Нейроканал
21.11.2025 14:03
ГигаЧат выпустил модель для синтеза речи GigaTTS Она звучит почти как реальный человек И нравится слушателям в 2 4 раза чаще чем старая версия Под капотом GigaChat 3b токенизатор адаптер к LLM и 30 тысяч часов данных GigaTTS использует уникальные голоса телефонных операторов и инструктивный синтез разных эмоций Она умеет клонировать голоса а также озвучивать тексты любой длины в multi turn режиме Новый синтез речи можно оценить в голосовом общении с ГигаЧат А узнать больше новостей от команды разработки в канале gigadev channel Подписывайтесь Это партнёрский пост
Нейроканал
20.11.2025 11:02
Kandinsky 5 0 новая линейка визуальных моделей в open source Сбер опубликовал в открытом доступе всю линейку Kandinsky 5 0 Video Pro Video Lite Image Lite и токенизаторы K VAE 1 0 Полный open source код веса лицензия MIT Video Pro Text to Video Image to Video Флагман генерирующий HD видео до 10 секунд с гибким управлением движением камеры Обучалась на 520 млн изображений и 250 млн видео а на финальном этапе доучивалась на датасете сверх качественных видеороликов тщательно отобранных профессиональными художниками и дизайнерами Нативно понимает русские и английские промпты генерирует надписи на латинице и кириллице Лучшая открытая модель в мире превосходит Wan 2 2 A14B в Text to Video SBS 59 41 и Image to Video SBS 53 47 а также достигает паритета с Veo 3 по визуальному качеству и динамике SBS 54 46 Video Lite Text to Video Image to Video Компактные модели генерации видео оптимизированные для запуска на GPU от 12 ГБ VRAM Обучалась на 520 млн изображений и 120 млн видео хорошая консистентность и качество динамики Лучшая среди небольших и быстрых моделей значительно превосходит в 7 раз большую по количеству параметров Wan 2 1 14B как в Text to Video SBS 67 33 так и Image to Video SBS 64 36 Image Lite Text to Image Image Editing HD генерация и редактирование изображений Претрейн Text to Image модели был сделан на 520 млн изображений включая датасет русского культурного кода 1 млн изображений Image Editing был дополнительно дообучен на 150 млн пар Для достижения финального качества был проведено SFT дообучение на 150 тыс изображений а также на 20 тыс пар для Editing Нативно понимает русские и английские промпты генерирует надписи на латинице и кириллице Значительно превосходит FLUX 1 dev по Text to Image SBS 63 37 и находится в паритете по качеству с FLUX 1 Kontext dev по Image Editing SBS 54 46 K VAE 1 0 2D 3D Вариационные автоэнкодеры для диффузионных моделей сжимающие входные данные в формате 8x8 изображения и 4x8x8 видео Сравнение на открытых датасетах показывает что модели более качественно восстанавливают исходный сигнал 0 5dB PSNR чем лучшие open source альтернативы Flux Wan Hunyaun обладающие той же степенью сжатия Все модели линейки доступны на GitHub Gitverse и HuggingFace Читайте подробнее в техническом репорте Это партнёрский пост
Нейроканал
19.11.2025 15:32
На Tproger вышел подробный обзор новой Google Gemini 3 как она работает с текстом изображениями и кодом что такое режим Deep Think и как получить доступ в РФ
Нейроканал
18.11.2025 20:46
Стала доступна Gemini 3 Pro свежая модель от Google Доступна в Gemini CLI для подписчиков Google AI Ultra в подписке Cursor и через платное API Для разработчиков ключевые цифры 1M контекстных токенов на вход до 64K на выход и многомодальность текст картинки аудио видео Применение для кодинга На бенчмарках Gemini 3 Pro показывает 54 2 на Terminal Bench 2 0 работа с терминалом и 76 2 на SWE bench Verified агентное кодирование Для сравнения Claude Sonnet 4 5 77 2 SWE bench GPT 5 1 76 3 то есть на уровне лучшего конкурента В VS Code раннее тестирование показало на 35 более высокую точность в решении инженерных задач по сравнению с Gemini 2 5 Pro Итого модель хороша в агентных задачах работе с терминалом и генерации кода из естественного языка И уже можно пробовать в курсоре вот только что появилась neuro channel
Нейроканал
12.11.2025 05:46
Учёные предложили новый тест Тьюринга отличать ИИ от человека по хамству Они протестировали девять открытых моделей и обучили классификаторы которые распознают ИИ ответы с точностью 70 80 Ключевые признаки эмоциональная окраска и стиль меньше агрессии иная тональность и отличия в социальном языке это сохраняется на разных платформах и архитектурах Подробнее в статье не Tproger neuro channel
Нейроканал
13.10.2025 08:05
Чуть не пропустил Стэнфорд запустил бесплатный курс по Deep Learning с участием Эндрю Ына Все лекции будут выкладывать на YouTube еженедельно а презентации и материалы уже доступны здесь В программе от основ нейросетей до LLM RL агентов RAG и мультимодальных моделей Обещают и практику и домашки то что нужно чтобы не только понять но и применить Забирайте подгон
Нейроканал
01.10.2025 14:04
Anthropic выпустила Claude Sonnet 4 5 свою самую мощную ИИ модель Код прямо в чате теперь Claude умеет запускать код создавать документы таблицы и презентации прямо в интерфейсе чата Поддержка VS Code появился официальный плагин для VS Code Контекст до 1M токенов долгосрочная память контроль состояния и точное продолжение работы Agent SDK Anthropic выложила инструменты с помощью которых сама строила Claude Code теперь они доступны всем Автономная работа до 30 часов Claude способен самостоятельно решать сложные задачи удерживая фокус без перерывов Рассказываем чем ещё интересна новая модель дляайтИИ
Нейроканал
01.10.2025 07:41
Вышла OpenAI Sora 2 И генерации этой модели действительно впечатляют В отличие от предыдущей версии Sora 2 симулирует физический мир и может создавать сцены где соблюдаются законы движения массы инерции и причинности В OpenAI заявили что новинка это скачок уровня GPT 3 5 но для видео Рассказываем что ещё умеет Sora 2 и как её протестировать прямо сейчас
Нейроканал
24.09.2025 10:39
ИИ создал новые вирусы Исследователи из Profluent объявили искусственный интеллект впервые спроектировал с нуля полноценные геномы бактериофагов которые оказались жизнеспособными и что особенно важно эффективно уничтожают бактерии устойчивые к антибиотикам Рассказываем что это за вирусы и зачем они нужны жИИзнь
Нейроканал
12.09.2025 10:59
В Албании появился ИИ министр для борьбы с коррупцией Власти Албании представили Diella первого в истории виртуального министра на базе искусственного интеллекта Она назначена ответственным членом кабинета министров за государственные закупки и будет курировать все тендеры чтобы исключить коррупционные схемы Рассказываем чем ещё будет заниматься ИИ министр