Psy Eyes
19.02.2026 17:28
Google выкатили Gemini 3 1 Pro В этом обновлении улучшили рассуждения и дали возможность их применять к данным в реальном времени Например можно используя публичный API телеметрии МКС сгенерить дашборд для отслеживания её орбиты Или для трейдинга спортивных мероприятий итд Gemini 3 1 Pro доступна глобально Сайт Твит
Psy Eyes
09.01.2026 17:52
Eleven Labs выпустили Scribe 2 Realtime для генерации текста из речи Модель заточена работать в реальном времени на 90 языках и подходит для агентов с голосовым режимом получения субтитров перевода итд Но фокус на агентах В отличие от предыдущей модели в линейке Scribe 2 Realtime лучше справляется с паузами дыханиями и шумами присущими человеческой речи Уже завезли в API Сайт Анонс
Psy Eyes
01.12.2025 15:38
Kling в рамках анонсированной омни недели запустили видеогенератор Kling O1 Это мультимодальная модель которой можно подавать на вход рефы разных форматов текст картинки и видео Одно видео стоит 40 кредитов Сайт Твит
Psy Eyes
07.08.2025 17:51
OpenAI: представили GPT-5. AI подтянули на данных по финансам, науке, юриспруденции, медицине, итд. Говорят если предыдущие модели были учениками-студентами, то это эксперт. Модель бьёт другие ллмки на бенчах, особенно в коде, математике и рассуждениях. GPT-5 больше опирается на фактыи меньше галлюцинирует. Может по короткому промту собрать на холсте интерактивное демо, например, показывающее как работают законы аэродинамики. Понимает голос и визуал. Есть режим обучения, где GPT по шагам будет помогать вникнуть в изучаемую тему. GPT-5 имеет контекст 256К токенов на вход и 128К на выход. Цена по API: $1,25 за 1 млн токенов на вход, и $10 за 1 млн токенов на выход. У GPT-5 mini контекстное окно такое же. Цена по API: $0,25 за 1 млн токенов на вход, и $2 за 1 млн токенов на выход. Ещё есть GPT-5 nano. Тут контекстное окно такое же, а цена по API: $0,05 за 1 млн токенов на вход, и $0,40 за 1 млн токенов на выход. GPT-5 доступна уже сейчас для бесплатных пользователей. Когда кончается лимит - пользователя переключает на GPT-5 mini, которая как утверждается лучше o3 mini. У владельцев Plus подписок лимиты выше. У Pro безлимит и доступ к GPT-5 Pro. Анонс API документация Сайт
Psy Eyes
18.06.2025 14:25
Hailuo: выпустили видеогенератор Hailuo 02. Улучшилось следование промту, качество картинки, и динамика объектов. Заметно подтянули физику, например в акробатике и симуляции жидкости. Хотя взаимодействия объектов драка, авария, итд , особенно когда их много, пока ещё даются тяжело. Модель работает в txt-2-vid и img-2-vid. Выдаёт 1080p с максимальной длиной 10 секунд. На бесплатном тарифе доступно 768p с длительностью 6 секунд. Цены: 768p 6 сек = 25 кредитов $0.25 , 10 сек = 50 кредитов $0.50 1080p только 6 сек = 80 кредитов $0.80 Подписка от $10/мес 1000 кредитов До 21 июня новым аккаунтам дают 500 халявных кредитов. Го пробовать! Анонс Сайт
Psy Eyes
17.06.2025 14:46
Krea: выпустили в открытый доступ свой генератор картинок Krea 1. На бесплатном тарифе в день можно генерить 11 изображений. Сайт Анонс
Psy Eyes
29.05.2025 08:07
Kling: обновили свой видеогенератор Kling до V 2.1. Изменения коснулись обычной модели и master. Что нового: Kling 2.1 Генерация видео в стандартном режиме — 720p, в профессиональном — 1080p 5 сек в стандартном режиме стоят 20 кредитов, в профессиональном 35 кредитов Работает пока только в image-2-video, позже подрубят text-2-video Kling 2.1 Master Улучшена динамика и следование промту Выдаёт 1080p по умолчанию Сайт Анонс Твит
Psy Eyes
25.04.2025 14:42
OpenAI: запустили генерацию картинок моделью gpt-image-1 через API. Можно попробовать на Playground. Она может использоваться как для создания новых изображений, редактирования существующих например, для смены стиля , или композиции разных объектов вместе. Работает с форматами 1:1 / 16:9 / 9:16 максимум 1024х1024 или 1536x1024. Может выдавать картинки с прозрачным фоном. Есть три режима качества Low, Medium, High, каждый из которых потребляет своё количество токенов. Финальная цена за генерацию = количество входных токенов + токенов на редактирование img2img + выходных токенов. На генерацию может уйти пара минут. Возможны проблемы с рендерингом текста, стабильностью персонажей, и композицией. Либо можно воспользоваться платформами, на которые модель уже подрубили: Comfy Higgsfield Krea ———————————————————— Создай своего цифрового двойника, оживи персонажа, или интегрируй бренд. Напиши —
Psy Eyes
31.03.2025 15:05
Runway: выкатили Gen-4. Обещают генерацию стабильных миров с консистентными персонажами. Управление персонажами как и контроль сцены станет послушнее. Можно делать съёмку с любого ракурса. Редактирование местами напоминает работу со слоями в фотошопе. Можно будет сфоткать объект из реального мира и закинуть его в модель, чтобы делать с ним видео. Качество и эстетичность стали ещё кинематографичнее. А физика взаимодействия объектов реалистичнее. На сайте пока нет инфы по кредитам за генерации. Говорят уже доступно платным подписчикам. У кого есть доступ дропайте тесты в комменты. Анонс Сайт
Psy Eyes
27.03.2025 12:07
Редактирование/генерация картинок промтом через Gemini навела суеты, и конкуренты начали выкатывать такие же фичи. OpenAI: добавили в ChatGPT генерацию изображений нативно через 4o, а не DALEE 3. Выдаёт отличное качество изображения, но может съедать детали или перегенерить сцену целиком вместо целевого объекта. Отлично слушается промта в том числе на русском , вписывает надписи, и работает со стилизацией. На удивление лёгкое отношение к цензуре. На данный момент раскатано для владельцев подписки Plus выше. Grok: редактирование картинок промтом добавили несколько дней спустя после Gemini. В плане качества и удерживания стиля тоже хорошо делает, как и работает с надписями на русском, но всё же ChatGPT генерит лучше. К цензуре более свободное отношение, чем у Gemini. Работает бесплатно с российским IP. Анонс ChatGPT ChatGPT Grok