Искусственный интеллект

Нейросети и ML

Машинное обучение, глубокие нейросети, архитектуры
Тем: 1,247
Ответов: 15,632
Обучение GPT с нуля
by AIResearcher
2 часа назад

Компьютерное зрение

Обработка изображений, распознавание объектов
Тем: 856
Ответов: 9,432
YOLO v8 vs v9
by VisionExpert
1 час назад

NLP и чат-боты

Обработка языка, ChatGPT, LLM модели
Тем: 2,156
Ответов: 23,891
GPT-5 когда выйдет?
by ChatBotDev
30 мин назад

Программирование

Python

Python для AI, библиотеки, фреймворки
Тем: 3,892
Ответов: 45,123
TensorFlow vs PyTorch
by PythonMaster
15 мин назад

JavaScript & Web

Веб-разработка, Node.js, фронтенд
Тем: 2,341
Ответов: 28,567
React vs Vue в 2024
by WebDeveloper
45 мин назад

Общие вопросы

Карьера, образование, книги, курсы
Тем: 1,567
Ответов: 18,234
Переход в IT в 30 лет
by CareerChanger
1 час назад

Нейросети и ML

Тема
Ответы
Просмотры
Последнее

Обучение GPT с нуля — пошаговое руководство

Создано AIResearcher • 2 дня назад
24 ответов
1,432 просмотров
Re: Обучение GPT с нуля
2 часа назад от NeuralNinja

PyTorch vs TensorFlow — что выбрать в 2024?

Создано MLExpert • 1 день назад
67 ответов
3,891 просмотров
Re: PyTorch vs TensorFlow
1 час назад от DeepLearner

Лучшие датасеты для начинающих в CV

Создано DataScientist • 3 дня назад
12 ответов
867 просмотров
Re: Лучшие датасеты
4 часа назад от VisionPro

Обучение GPT с нуля — пошаговое руководство

User

Привет всем! Решил поделиться своим опытом обучения GPT модели с нуля. Это довольно сложный процесс, но результат того стоит.

Что нам понадобится:

  • Мощная GPU (желательно A100 или V100)
  • Большой датасет текстов
  • Python + PyTorch/TensorFlow
  • Терпение 😄

Начнём с подготовки данных. Это самая важная часть...

"Искусственный интеллект — это новое электричество" - Andrew Ng
User

Отличный гайд! Добавлю от себя — очень важно правильно настроить learning rate. Я использовал cosine annealing scheduler и результаты значительно улучшились.

Также рекомендую обратить внимание на gradient clipping, особенно на начальных этапах обучения.

User

Спасибо за подробное объяснение! У меня вопрос по поводу размера батча. Какой optimal batch size вы использовали?

И еще — стоит ли использовать mixed precision training для ускорения?

⚡ Сделано на AlfaCI Убрать баннер →