10 июня, 10:07
Андрей Карпатый выпустил 4-часовой туториал по тренировке GPT-2 с нуля на Python
эйай ньюз
Карпатый выпустил туториал о тренировке LLM с нуля За 4 часа он с нуля пишет GPT-Nano, при этом объясняя каждый шаг. Пока что на Python и только про претрейн, но обещает сделать туториал о создании llm.c и сделать туториал про файнтюн. Почему он учит GPT-2? Это первая LLM, с неё и началась современная эпоха. К тому же, между ламой и GPT-2 всего дюжина отличий, но GPT-2 Small можно полностью натренировать на одной GPU и сравнить свой трейнинг ран с результатами пейпера. С ламой такое не прокактит. Туториал Код #ликбез
CodeCamp
В мире ИИ-энтузиастов сегодня волнения — исследователь Андрей Карпаты директор ИИ в Tesla выпустил 4-часовой туториал, который показывает, как у себя дома натренировать ChatGPT. Сразу о главном нюансе — речь идет о GPT-2 больше домашнее железо не потянет , хотя между ней и современной LLaMa не так уж и много отличий. Андрей step-by-step показывает процесс тренировки, объясняя каждый шаг. Если вы работаете с ML или просто интересно посмотреть, из чего состоят LLM — обязательно к просмотру.
Анализ данных (Data analysis)
4х-часовой Мастер-класс по созданию GPT-2 с нуля от Андрея Карпаты Соучредитель OpenAI Андрей Карпаты выпустил подробную 4-часовую лекцию по созданию модели GPT-2 на Python с нуля. Он разъясняет каждый шаг, начиная с создания пустого файла, настройкb гиперпараметров, при этом подробно описывая архитектуру и оптимизацию. сначала создаем GPT-2 - затем мы оптимизируем ее для очень быстрого обучения - затем мы настраиваем оптимизацию процесса обучения и гиперпараметров, ссылаясь на материалы статьи GPT-2 и GPT-3 - затем мы проводим оценку модели, и Смотреть Github
NN
Соучредитель OpenAI записал большой гайд по созданию собственного GPT-2 с нуля. Язык — Python. Четыре часа Андрей Карпаты рассказывает, как создать модель и оптимизировать ее обучение. Более того, настроить тренинг так, чтобы лечь спать и проснуться уже к моменту, когда GPT-2 будет готова. Смотрим гайд тут.
Data Secrets
Андрей Карпаты выложил 4-часовое видео о том, как воспроизвести GPT-2 с нуля на Python 4 часа??? Да, видео начинается с пустого файла, и вы своими глазами видите, как из него рождается LLM, при этом Андрей подробно объясняет каждый шаг вот у кого точно выходные прошли продуктивно . В комплекте не только написание самой архитектуры, но и оптимизация кода, и настройка гиперпараметров, и оценка метрик. Ну вы поняли, маствотч. Кстати, Карпаты – вообще большой любитель образовательного контента. Вот другие лекции и имплементации от ученого: Лекция «Введение в большие языковые модели» Код GPT-2 на чистом C Большая лекция про токенизацию в LLM и реализация BPE с нуля Лекция про обучение ChatGPT Лекция-интервью про будущее ИИ
Бэкдор
Пушка: соучредитель OpenAI Андрей Карпаты залил на Ютуб 4-часовую лекцию о том, как создать GPT-2 с нуля на Python! Андрей стартует с пустого файла и на глазах собирает в нём модель — с пошаговым объяснением. Другие лекции на канале Андрея: • Введение в LLM • Создаём токенайзер • Обучаем нейросеть • Интро в Language Modeling • Создаём GPT за два часа Смотрим и роняем Сэма Альтмана прямо с утра понедельника! Бэкдор
Нейросфера: нейросети, технологии
Соучредитель OpenAI Андрей Карпаты залил на Ютуб 4-часовую лекцию о том, как создать GPT-2 с нуля на Python! Андрей стартует с пустого файла и на глазах собирает в нём модель — с пошаговым объяснением. Другие лекции на канале Андрея: • Введение в LLM • Создаём токенайзер • Обучаем нейросеть • Интро в Language Modeling • Создаём GPT за два часа
Похожие новости +3 +3 +3
Thinking Machines анонсирует новые модели взаимодействия с ИИ для живого общения
Технологии
1 день назадGoogle предотвращает первую атаку с использованием ИИ на двухфакторную аутентификацию
Технологии
1 день назадСотрудники OpenAI реализовали акции на 6,6 миллиарда долларов
Экономика
1 день назадКонференция AI2Business и прием докладов на Saint HighLoad 2026: внедрение ИИ в бизнес и разработку
Технологии
7 часов назадСемья студента подала в суд на OpenAI из-за смертельных советов ChatGPT
Происшествия
7 часов назадВ Москве стартовал IV Форум по доверенному ИИ и III Конференция по ИИ в библиотечно-информационной деятельности
Общество
6 часов назад