Большая подборка видео про большие языковые модели
16.12.2024
Андрей матюков
Много обучающего видео 2024 года от российских экспертов в технологиях искусственного интеллекта и ML-разработке
Большая подборка видео 2024 года про большие языковые модели (LLM) от российских экспертов в технологиях искусственного интеллекта и ML-разработке.
Введение в LLM
В первом плейлисте собраны записи о том:
Что такое нейронные сети
Что такое NLP
Что такое LLM
Как думают LLM
Что могут знать LLM
Как готовить и внедрять LLM
Как оценивать качество LLM
Введение в LLM
https://rutube.ru/video/369cedcf720a20c6250d8ec421928da0/; Введение в нейронные сети (Сбер); 56:05; 🔸 Устройство нейрона 🔸 Полносвязные нейронные сети 🔸 Функции активации 🔸 Градиентный спуск и оптимизация нейросетей
https://rutube.ru/video/3617c175ae1abafc68f7d8314543ced2/; Введение в NLP (Сколтех); 45:40; 🔸 Особенности предобработки данных: токенизация, векторизация 🔸 Модели для обработки текстов 🔸 Модель трансформер и архитектуры 🔸 Другие модели семейства трансформер
https://rutube.ru/video/b406b4329ba09826a7a137f7a21aad9c/; Введение в LLM (Сбер); 54:25; 🔸 Что такое LLM и где оно используется 🔸 Этапы и цена обучения 🔸 Оценка работы LLM 🔸 Готовые реализации (YaGPT, GIGACHAT) 🔸 Какие инструменты может использовать LLM 🔸 Проблемы LLM
https://vk.com/video-38818370_456239218; Как подготовить и внедрить большие языковые модели (MТС Web Services); 1:11:47; 🔸 Сценарии применения LLM 🔸 Задачи, которые не стоит решать с LLM 🔸 Выбор и внедрение модели 🔸 Интеграция и дообучение 🔸 Развитие чат-ботов
https://vk.com/video-17796776_456241124; Человек и LLM. Как оценивать качество моделей и строить метрики; 38:48; 🔸 Почему чем лучше становятся LLM-модели, тем сложнее построить систему оценки их качества 🔸 Как строить метрики LLM 🔸 Какие бенчмарки самые правильные и надёжные 🔸 Нужны ли эксперты и как выстраивать процессы разметки данных
https://vk.com/video-39755794_456239357; Мир - это текст? Всё ли могут знать LLM; 1:02:54; 🔸 Можно ли свести все человеческие знания к тексту? 🔸 Какова связь между языком и реальностью? 🔸 Существуют ли знания вне языка? 🔸 Как приобретают знания люди и LLM? 🔸 Что говорят результаты первых нейропсихологических исследований LLM?
https://vk.com/video-39755794_456239272; Как думают LLM?; 1:02:46; 🔸 Сравнение понятия интерпретации модели в квантовой физике и в задаче вывода LLM 🔸 Как LLM выполняет сложные рассуждения на основе внутреннего устройства с точки зрения программиста 🔸 Последние результатами интерпретации LLM с использованием карт активности нейронов
Применение LLM
В этом плейлисте собраны записи о применении LLM для:
Техподдержки
Системных аналитиков
Разработчиков
Продактов
Бизнеса
Применение LLM
https://vk.com/video-65336816_456239571; Где в продукте получить пользу от LLM (Т-Банк); 40:01; 🔸 Что такое новый клиентский опыт и где на рынке уже применяют LLM 🔸 Как такие продукты запускать и измерять, как сводить экономику 🔸 Как дёшево тестировать и проверять, надо ли оно вам
https://vk.com/video-147415323_456240175; Реальная польза от LLM на примере Universal NER (ВКонтакте); 24:39; 🔸 Очень хочется использовать LLM везде, а для этого нужно и много железа, и новая экспертиза, причём не только в разработке, но и у заказчика 🔸 Где может пригодиться LLM как инструмент разработчика
https://vk.com/video-151223562_456239479; LLM для автоматизации поддержки (Т-Банк); 18:48; 🔸 Как LLM поменял ландшафт промышленного машинного обучения
https://vkvideo.ru/video-164555658_456241315; Создание call-ботов на базе LLM в 2024 году (Raft); 30:09;
https://vk.com/video-215425037_456239553; LLM для системных аналитиков на практике (Альфа-Банк); 36:43; 🔸 Онлайн-демонстрация работы системного аналитика с ChatGPT на реальной задаче
https://vk.com/video-151223562_456239538; Как делать LLM Alignment без тысячи ИИ-тренеров (Т-Банк); 23:42; 🔸 Как устроены профессии ИИ-тренеров и как мы делаем alignment в Т-Банке
https://vk.com/video-17796776_456241118; LLM для разработчика — как обучали модель кодить (Yandex Infrastructure); 42:01; 🔸 Как команда создавала AI-ассистента для разработчиков 🔸 Как дообучали модели на реальном коде 🔸 Почему решили предсказывать именно стейтменты 🔸 Какие метрики и способы оценки качества разработали
https://vk.com/video-151223562_456239475; Особенности продуктового внедрения LLM (Т-Банк, Яндекс, AI VK); 37:33; 🔸 Как эффективно решать бизнес-задачи при помощи LLM
https://vk.com/video3061371_456239288; LLM для владельцев продукта (ЛАНИТ); 44:08; 🔸 Что сработало при использовании LLM в работе аналитиков и продактов 🔸 Нам уже пора пересматривать подходы к нашей работе?
https://vk.com/video-151223562_456239617; Изменили ли LLM бизнес? (Т-Банк); 46:43; 🔸 Как продакты используют LLM 🔸 Языковые модели в бизнесе 🔸 Как разрабатывают продукт на основе языковых моделей 🔸 Как и зачем Т-Банк сделал собственную большую языковую модель T-lite 🔸 Внедрять ли LLM в бизнес: за и против
https://vk.com/video-220010299_456239067; Действительно ли LLM подходящий инструмент для решения вашей задачи (Альфа-Банк); 1:27:57; 🔸 Как эффективнее «приземлять» LLM в практические бизнес-кейсы
https://vk.com/video-151223562_456239530; Как управлять экспериментами с LLM, чтобы не скатиться в «скрытую угрозу» (ЛАНИТ); 17:34; 🔸 Какие задачи бизнеса могут решать большие языковые модели? 🔸 Есть ли от них реальный экономический эффект или это просто бесполезная магия? 🔸 В одной компании одну и ту же LLM-головоломку могут параллельно решать специалисты из разных отделов и департаментов, даже не зная об опыте друг друга 🔸 Что бывает, когда работа с моделями обучения ведется хаотично 🔸 Возможные шаги по контролю LLM на разных уровнях: команда — инфраструктура — группа компаний
Продвинутое использование LLM
Здесь представлена подборка выступлений и мастер-классов о продвинутом использовании больших языковых моделей и вопросах безопасности. Вы найдете ответы на такие вопросы:
Какие бывают типы LLM-приложений
Из каких компонент состоит LLM-приложение
Что реально дают агенты в продуктовой задаче
Когда RAG, а когда Fine-Tune
Почему нам тут просто LLM не бахнуть
Где все ещё работают классические методы
Как с помощью ленты рекомендаций Шедеврум можно влиять на KPI-метрики сервиса
Архитектура рекомендаций с точки зрения ML
Мультимодальные подходы и LLM
Опыт оптимизации инференса LLM для генерации кода в AI-ассистенте разработчика
Продвинутое использование LLM
https://vk.com/video-151223562_456239476; Подходы к построению LLM-приложений (Т-Банк); 24:57; 🔸 Типы LLM-приложений 🔸 Когда RAG, а когда Fine-Tune? 🔸 Из каких компонент состоит LLM-приложение? 🔸 Что реально дают агенты в продуктовой задаче
https://vk.com/video-226874221_456239326; ML в эпоху LLM (MTS AI); 31:50; 🔸 Почему нам тут просто LLM не бахнуть? 🔸 Где все ещё работают классические методы?
https://vk.com/video-223945985_456239032; Рекомендательная система в приложении с социальными механиками (Шедеврум); 45:54; 🔸 Как с помощью ленты рекомендаций Шедеврум можно влиять на KPI-метрики сервиса 🔸 Архитектура рекомендаций с точки зрения ML
https://vkvideo.ru/video-210514085_456239127; Генерация полноценных видео по тексту, а также при чём тут general world models (Sber AI); 1:12:55
https://vk.com/video-210514085_456239093; Мультимодальные подходы и LLM (FusionBrain AIRI); 1:21:22;
https://vk.com/video-182881521_456239363; Опыт оптимизации инференса LLM для генерации кода в AI ассистенте разработчика GigaCode; 17:17;
Безопасность и галлюцинации LLM
Эти видео про безопасность и галлюцинации больших языковых моделей:
Обзора уязвимостей LLM
Способы защиты от атак при использовании LLM
Методы и подходы для повышения безопасности LLM
Как LLM становятся новой целью для злоумышленников
Запуск LLM в продуктах Mail
Запуск языковых моделей локально
Плагины и утилиты для удобного взаимодействия с LLM
Повышение релевантности ответов моделей при малых вычислительных ресурсах
Зачем в YandexGPT совместили поисковую систему и генеративные нейросети
Можно ли вычислить неуверенность модели элицитацией
Можно ли с помощью определения неуверенности языковой модели уменьшить количество галлюцинаций и повысить reliability модели
Безопасность и галюцинации LLM
https://vk.com/video-22522055_456244331; Безопасность LLM (Raft); 39:52; 🔸 Обзора уязвимостей LLM 🔸 Способы защиты от атак при использовании LLM 🔸 Методы и подходы для повышения безопасности LLM
https://vk.com/video-215425037_456239554; Уязвимости приложений с LLM (Альфа-Банк); 37:16; 🔸 Как большие языковые модели, став мощным инструментом для бизнеса, одновременно становятся новой целью для злоумышленников и представляют потенциальные угрозы, о которых важно знать каждому аналитику
https://vk.com/video-147415323_456240533; Локальные LLM для разработки. Как упростить рутинные действия и не расстраивать ИБ (Mail); 37:27; 🔸 Запуск LLM в продуктах Mail 🔸 Запуск языковых моделей локально 🔸 Плагины и утилиты для удобного взаимодействия с LLM 🔸 Повышение релевантности ответов моделей при малых вычислительных ресурсах
https://vk.com/video-17796776_456241214; Как отучить LLM придумывать и дать людям новый способ искать ответы (YandexGPT); 21:22; 🔸 Зачем в YandexGPT совместили поисковую систему и генеративные нейросети и как это работает 🔸 Как устроен Нейро под капотом и сколько нейросетей трудятся над созданием ответа 🔸 Что ищут люди через Нейро и о чем они просят
https://vk.com/video-223945985_456239022; Галлюцинации в LLM: что это и как с ними бороться? (Sber Devices); 46:59; 🔸 Методы детекции «галлюцинаций» LLM и борьбы с этим явлением
https://vkvideo.ru/video-210514085_456239133; Методы определения неопределённости языковых моделей (Embodied AI Reading Club); 38:37; 🔸 Семантическая энтропия, решающая проблему получения разной энтропии у семантически эквивалентных предложений в различных формулировках 🔸 Можно ли вычислить неуверенность модели элицитацией 🔸 Можно ли с помощью определения неуверенности языковой модели уменьшить количество галлюцинаций и повысить reliability модели
RAG-технология
Это раздел видео об использовании RAG-технологии для разработки приложений и ботов. Рассматриваемые вопросы:
Что такое RAG, принцип работы и применение в приложениях
Проблемы и ограничения LLM и RAG, методы их решения
Популярные индексы векторных баз данных
Улучшение качества поиска и ответов
Как построить YaGPT-приложение на облачной инфраструктуре
Как применить мультиагентный подход для построения вопросо-ответной системы
Эксперименты с различными структурами данных для RAG, в том числе с текстовыми и графовыми
Мультимодальность и RAG
RAG-технология
https://vk.com/video-39755794_456239278; От LLM к RAG. Строение и применение (Artezio); 1:04:23; 🔸 Что такое RAG, принцип работы и применение в приложениях 🔸 Проблемы и ограничения LLM и RAG, методы их решения 🔸 Популярные индексы векторных баз данных 🔸 Улучшение качества поиска и ответов
https://vk.com/video-223945985_456239025; Построение RAG-приложения с использованием YandexGPT (Yandex Cloud); 54:10; 🔸 Возможности YaGPT 🔸 Как построить YaGPT-приложение на облачной инфраструктуре
https://vk.com/video-17796776_456241136; Мультиагентные подходы для работы с LLM (Yandex Cloud); 1:50:00; 🔸 Как применить мультиагентный подход для построения вопросо-ответной системы 🔸 Эксперименты с различными структурами данных для RAG, в том числе с текстовыми и графовыми 🔸 В качестве примера — языковая модель YandexGPT и другие ML-сервисы Yandex Cloud
https://vkvideo.ru/video-164555658_456241329; Мультимодальность и RAG, или как сесть на два стула (Сибирские нейросети); 28:56;
Разработки на основе NLP
В этом плейлисте собраны записи про разработки на основе обработки естественного языка.
Особенности предобработки данных: токенизация, векторизация
Модели для обработки текстов
Модель трансформер и архитектуры
Другие модели семейства трансформер
Как в распределенном сетапе ускорить модель и оптимизировать использование памяти
Сравнение различных LLM и техник промптинга
Эксперименты по использованию LLM в разметке данных
Как проходит процесс разметки с людьми и без них
Введение в NLP
https://vk.com/video-223945985_456239033; Обучение GigaChat с контекстом в сотни тысяч токенов (Sber Devices); 46:17; 🔸 Как в распределенном сетапе ускорить модель и оптимизировать использование памяти 🔸 Пайплайн подходов, на котором обучался GigaChat, позволяющий обучать и использовать модели на контексте в сотни тысяч токенов
https://vk.com/video-164555658_456241291; LLM vs асессоры: как получить качественную разметку текстовых данных (VK Реклама); 37:38; 🔸 Как размечали датасет с помощью асессоров, и что пошло не так 🔸 Как размечали датасет с помощью LLM 🔸 Сравнение различных LLM и техник промптинга
https://vk.com/video-17796776_456241121; Использование LLM в разметке данных: можно ли убрать людей? (Сбер); 32:03; 🔸 Эксперименты по использованию LLM в разметке данных 🔸 Как проходит процесс разметки с людьми и без них
https://vk.com/video-164555658_456241211; Маленькая, но удаленькая! Зачем использовать LLM размером меньше 1B параметров? (НГУ); 34:32;
Промпт-инженерия
Это подборка выступлений о промпт-инженерии поможет ответить на следующие вопросы:
Как изменялось понимание важности правильного формулирования промпта для получения от LLM желаемого, правильного, полезного ответа
Как и почему появился промпт-инжиниринг
Как развивались техники проектирования эффективных промптов
Промпт-инженерия
https://vk.com/video-39755794_456239267; Близкие контакты с LLM. Эволюция промптинга (Artezio); 57:44; 🔸 Как изменялось понимание важности правильного формулирования промпта для получения от LLM желаемого, правильного, полезного ответа 🔸 Как и почему появился промпт-инжиниринг 🔸 Как развивались техники проектирования эффективных промптов
https://rutube.ru/video/0d5664a4e541e4700d0072b6ee7a0560/; Промпт-инженерия в LLM (Карпов курсы); 1:04:23;
Понравилась статья? Нажми на Лайфика!
Хотите обзор своего продукта или мероприятия? Пишите: