Avsnitt

  • С командой дата-сайентистов из ВТБ подводим итоги 2023 года в темах развития нейросетей, машинного обучения, инструментов на базе ИИ. Конечно же говорим про большие языковые модели и начало гонки генеративного AI среди бигтехов. Делимся своим опытом использования нейросетей в работе и в жизни. Говорим об этике, философски обсуждаем настоящее и немного фантазируем о будущем. И пытаемся узнать, когда ИИ поработит человечество.

    Участники:

    • Антон Бабак, тимлид в команде перспективных алгоритмов машинного обучения

    • Иван Яруков, Senior DS, моделирование в крупном бизнесе и СМБ

    • Анатолий Глушенко, тимлид DS, моделирование партнерств и ИТ-процессов

    Ведущая:

    • Технологический обозреватель Марина Эфендиева

    Подпишитесь, чтобы послушать другие эпизоды сезона Data Science в подкасте «Деньги любят техно».

  • Машинное обучение так или иначе уже применяется в компаниях самых разных масштабов и направлений деятельности. Однако для выстраивания зрелой ML-инфраструктуры и перехода к эффективным MLOps-практикам требуется понимание: с чего начать, на какие платформы обратить внимание, к каким инструментам присмотреться внимательнее, а какие подойдут лишь для разовых экспериментов.

    К инструментам MLOps для больших исследовательских и бизнес-задач предъявляется три базовых требования: интерпретируемость, воспроизводимость, надёжность. Как среди десятков Open-Source-инструментов выбрать правильные, что могут или не могут использовать компании, к которым предъявляются высокие требования стандартизации, на чем должен основываться выбор между облаками и InHouse для ML — в третьем выпуске серии MLOps обсудили Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ.

    Подпишитесь, чтобы не пропустить новые эпизоды сезона Data Science в подкасте «Деньги любят техно».

    Дополнительные материалы:

    Ссылки на полезные ресурсы к этому эпизоду ищите в нашем блоге на Хабр: https://habr.com/ru/companies/vtb/news/778270/

  • Saknas det avsnitt?

    Klicka här för att uppdatera flödet manuellt.

  • Во второй части большой темы про MLOps, которую мы разбили на несколько эпизодов подкаста, ещё глубже погружаемся в тему машинного обучения и работы с данными, лежащей в основе ML. Рассматриваем вопросы обогащения данных, разбираемся с разметкой, говорим о специфических аспектах управления данными.

    В этом выпуске вы услышите:

    Почему общепринятых стандартов управления данными недостаточно для работы с большими данными для ML;

    Что такое хвосты и артефакты в сверхбольших данных;

    Может ли overfeeding стать причиной overfitting’a (или это одно и то же?);

    И многое другое!

    Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, подошли к теме с двух сторон: теоретической и практической. Помогли ведущей подкаста разобраться с терминологией. А также поговорили про специфику подходов к образованию для специалистов в Data Science, DataOps и MLOps.

    Полезные ресурсы и ссылки:

    Курс MLOps (OTUS): https://otus.ru/lessons/ml-bigdata/

    Основные идеи из книги «Сотрудничество в DevOps-культуре»: http://agilemindset.ru/основные-идеи-из-книги-сотрудничест/

    MLOps: Continuous delivery and automation pipelines in machine learning: https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning

    Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана: https://habr.com/ru/companies/vk/articles/749850/

    Как создавать качественные ML-системы. Часть 2: приручаем хаос: https://habr.com/ru/companies/vk/articles/749852/

    The Data Engineering Cookbook: https://github.com/andkret/Cookbook

    Стандарты:

    ISO/IEC DIS 5259-1: https://www.iso.org/standard/81088.html

    ISO/IEC DIS 5259-4: https://www.iso.org/standard/81093.html

    ISO/IEC 8183:2023: https://www.iso.org/standard/83002.html

  • О нейронных сетях мы слышим сегодня буквально отовсюду. Это — одно из наиболее активно развивающихся направлений в машинном обучении. В новом выпуске подкаста «Деньги любят техно», сезон Data Science, пробуем зайти в тему нейросетей с необычного ракурса.

    С Артемом Летиным, начальником управления корпоративного моделирования ВТБ, Евгением Смирновым, руководителем Лаборатории машинного обучения Альфа-Банка и Никитой Зелинским, руководителем центра компетенций Data Science МТС говорим о применении нейросетей в кредитном скоринге и других сегментах деятельности финансовых организаций.

  • В этом выпуске мы возвращаемся к теме MLOps — на этот раз с Алексеем Незнановым, к.т.н., старшим научным сотрудником международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, и Юрием Каревым, руководителем управления процессов и стандартов моделирования и машинного обучения ВТБ.

    Начинаем с обсуждения самого понятия MLOps: что это — необходимые для большой компании практики или очередная хайповая тема? Как интегрировать MLOps в производственные IT процессы и зачем это делать? Насколько на развитие этого направления влияют вопросы управления данными, очистки данных, и решены ли они.

    Спойлер: это первый выпуск на тему MLOps из запланированной серии. Подпишитесь, чтобы не пропустить продолжение.

  • Мы рады поделиться первым выпуском четвёртого сезона подкаста «Деньги любят техно» — и это уже второй сезон, посвящённый темам Data Science. Сразу же решили обсудить животрепещущую тему датасетов для искусственного интеллекта: их доступность, их источники, вопросы регулирования и востребованности рынком.

    В этом выпуске — Алексей Каширин, директор Центра продвинутой аналитики Альфа-Банка и Сергей Голицын, вице-президент, заместитель руководителя Департамента анализа данных и моделирования ВТБ поговорили о применении датасетов в финтехе и других отраслях, поделились опытом работы своих команд, рассказали о самых заметных событиях и конкурсах в этой области.

  • С Кириллом Кулаковым, техническим консультантом «Лаборатории Касперского», и Лилией Шароватовой, начальником управления анализа и мониторинга операций ВТБ, обсуждаем привычные и совершенно новые уловки мошенников.

    Звонят ли клиентам банки? Что делать, если вас по телефону пытаются уговорить перевести деньги на другой счет? Почему для сохранения денег от мошенников важны не только банковские технологии, но и финансовая грамотность клиентов — эксперты поделились мнениями и историями на эти темы.

  • Чем больше мы доверяем ИИ, тем чаще слышим о его ошибках и уязвимостях. Пробуем разобраться, какие с этим связаны риски сейчас и какие появятся в будущем. Почему многое зависит от входных данных на этапе обучения нейросети. И как часто в жизни встречаются адверсальные атаки.

    Дмитрий Берестнев, лидер стрима разработки моделей для партнеров и Платформы больших данных ВТБ, поговорил об этом с Григорием Кабатянским, д. ф.-м.н., вице-президентом по академическому сотрудничеству Сколтеха, и Иваном Фурсовым, специалистом в области разговорного искусственного интеллекта. Получилась одна из самых жарких дискуссий в специальной DS-серии нашего подкаста.

  • Чаще, сильнее, продолжительнее. Этими тремя словами можно описать кибератаки, обрушившиеся в 2022 году на инфраструктуру российских компаний.

    Подводим итоги уходящего года в области кибербезопасности вместе с Сергеем Безбоговым, старшим вице-президентом ВТБ, и Сергеем Головановым, главным экспертом «Лаборатории Касперского». Говорим о том, кого, как и откуда атаковали хакеры, как трансформировались старые угрозы и какие возникли новые, а также почему специалистам по ИБ не придется расслабляться в следующем году.

  • В России каждая четвертая компания использует технологии сбора и обработки больших данных, а в финансовой отрасли — почти каждая вторая компания. Обсуждаем тренды развития рынка данных: почему все чаще звучат идеи объединения данных из разных источников — естественно, безопасного и обезличенного. Нужно ли такое объединение данных бизнесу, и решения каких технологических задач оно потребует от дата-сайентистов.

    В новом выпуске подкаста «Деньги любят техно» серии Data Science на эти темы потеоретизировали вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ Сергей Голицын и директор по разработке RnD центра Big Data МТС Никита Зелинский.

  • Экспериментальный выпуск, который поможет эффективнее бороться с категоричностью и с крайностями в суждениях. Такого ещё никто не делал, а мы попробовали. В новом выпуске постарались выяснить, является ли профессия дата-сайентиста одной из древнейших.

    В дискуссии приняли участие специалисты из самых разных областей:
    Бронислав Виногродский, китаевед, писатель, переводчик основополагающих китайских текстов; Константин Воронцов, доктор физико-математических наук, профессор РАН, МГУ и МФТИ; Дмитрий Доронин, социальный антрополог, этнограф, научный сотрудник РГГУ и РАНХиГС; Наталия Пузырникова, заместитель председателя правления, руководитель службы управления рисками Газпромбанка; Денис Суржко, начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ. Ведёт дискуссию Вадим Кулик, заместитель президента-председателя правления ВТБ.

  • Для чего сегодня применяется MLOps и в каких задачах без него не обойтись завтра? Помогает ли MLOps бизнесу развивать Data Science или, может быть, мешает? В чём заключается роль специалиста по ML, и как специализации будут дробиться в будущем? В конце-концов, кто всем этим должен заниматься и где этому учат — обсуждаем с Юрием Каревым, руководителем управления процессов и стандартов моделирования и машинного обучения ВТБ, и Петром Ермаковым, ML Brand Director Яндекса.

  • Следующий год станет годом пробных проектов с цифровым рублём. Что это такое, как это будет работать, для чего его можно будет использовать? Цифровой рубль — это безопасно? И насколько это будет удобно?

    Технологический обозреватель Марина Эфендиева и главный редактор ресурса финансовой грамотности «Мои финансы РФ» Надя Грошева расспросили о настоящем и будущем «третьей формы денег» Леонида Кожинского, начальника управления омниканальных микросервисных решений ВТБ.

  • Как необходимо развиваться сегодня, чтобы AutoML не заменил вас завтра?

    О практической и философской стороне AutoML, изменениях в роли специалиста в Data Science, прошлом и будущем построения моделей и возможностях Искусственного интеллекта рассуждают профи — Денис Суржко, начальник управления перспективных алгоритмов машинного обучения ВТБ и Алексей Натёкин, диктатор ODS.

  • Александр Сахнов, руководитель отдела мультивариативного анализа X5 Group и Артём Летин, руководитель подразделения разработки моделей для корпоративного сегмента клиентов ВТБ обсудили метод А/В-тестирования для оценки изменений в бизнесе. Где, кроме маркетинга, применяются A/B-тесты, на какие этапы делится этот процесс и когда начинается работа дата сайентистов? Говорим в подкасте о подходах, плюсах и минусах проверок бизнес-идей и гипотез с помощью методик А/В-тестирования и возможностях автоматизации этого процесса.

  • Россия, год 2022. Из крупнейших магазинов приложений исчезают важные и нужные аппы. Это — ощутимая проблема и для пользователей, и для компаний. Операционный директор RuStore Илья Сверчков и управляющий директор цифрового бизнеса ВТБ Юрий Герасименко рассказали, через какие испытания пришлось пройти командам разработчиков, чтобы удаление приложений не ударило по пользователям. Обсудили, может ли веб стать полноценной заменой аппу, и насколько легко пользователи адаптируются к альтернативам.

  • Директор по стратегическому маркетингу «Яндекса» Андрей Себрант, руководитель департамента цифрового бизнеса ВТБ Никита Чугунов и технологический обозреватель Марина Эфендиева обсудили главные технологические тренды 2021 года.
    Зелёная повестка, беспилотники, информационная безопасность, блокчейн и, конечно, метавселенная, о которой не хотелось говорить, но пришлось. Что было, что будет, чем сердце успокоится — слушайте в этом подкасте.

    С наступающим 2022 годом, друзья! Пусть он будет к нам добрее, чем его предшественник.

  • В новом выпуске обсуждаем, как деятельность дата-сайентистов влияет на общество и жизнь людей в целом. Почему необходимо менять подходы к образованию специалистов по Data Science и что делать, чтобы человечество не вымерло. Рассказываем о новой магистерской программе «4 И» МФТИ и ВТБ — на стыке технологий искусственного интеллекта и реальных управленческих задач в современном социальном контексте.
    Гости выпуска:
    - Доктор физико-математических наук, профессор РАН, заведующий кафедрой машинного обучения и цифровой гуманитаристики МФТИ Константин Вячеславович Воронцов;
    - Начальник управления перспективных алгоритмов машинного обучения департамента анализа данных и моделирования ВТБ Денис Суржко.

  • В новом выпуске подкаста обсуждаем безналичную реальность — сервисы p2p-платежей и культуру p2p-благодарности.

    Как поблагодарить официанта в ресторане, если у вас нет наличных? Сколько оставлять на чай и в каких случаях этого можно не делать? Как быть с «чаем» на заправке, в салоне красоты, при доставке товаров на дом? И являются ли электронные чаевые реальным стимулом для развития качественных услуг?

    Обсуждаем эти вопросы с руководителем проекта «Афиша-Рестораны» Михаилом Шенштейном и руководителем продукта «ВТБ-чаевые» Дмитрием Хабибулиным.

  • Зайти в офис без пропуска, получить кредит без визита в банк, пройти по аэропорту без задержек. В новом выпуске подкаста обсуждаем, где, для чего и как применяется биометрия сегодня и какое будущее её ждёт. Что удобнее — отпечатки пальцев или распознавание лица? И как мошенники пытаются обмануть биометрические сервисы.
    Гости выпуска:
    - Григорий Сальников, начальник управления «Единая клиентская идентификация», ВТБ;
    - Александр Ханин, руководитель Центра искусственного интеллекта МТС, сооснователь и председатель Совета директоров компании VisionLabs.