Аватар автора

neurozeh

tech

1911 Подписчиков
73 Сообщений
14 Показано сообщений
Не указана Дата добавления
ГлавнаяАвторыneurozeh

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
Что нового в мире ИИ Anthropic запустила Project Glasswing и создала модель Claude Mythos которая умеет находить критические уязвимости в операционных системах и инфраструктурном ПО Некоторые из этих уязвимостей оставались незамеченными десятилетиями Из за рисков модель не выпущена публично вместо этого к ней получили доступ AWS Apple Google Microsoft NVIDIA и Cisco для аудита своих систем Z ai выпустила GLM 5 1 открытую модель для агентного программирования Умеет автономно работать до 8 часов без участия человека например исправлять код или собирать Linux десктоп с нуля В бенчмарке SWE Bench Pro набрала 58 4 балла и стала лучшей среди всех существующих моделей Среди открытых моделей занимает первое место по кодингу в общем рейтинге третье Anthropic запустила Claude Managed Agents Раньше для создания ИИ агентов в облаке приходилось вручную настраивать инфраструктуру управлять данными и обновлениями Теперь платформа берет это на себя и сама управляет запуском хранением данных и обработкой ошибок Агенты поддерживают длительные сессии работы и мониторинг действий в реальном времени Публичная бета уже доступна Ideogram добавил редактируемые текстовые слои Теперь текст на постерах обложках или графике для соцсетей можно менять после генерации Каждая строка становится отдельным элементом можно выделить отредактировать поменять шрифт Доступно бесплатно и через API Meta запустила Muse Spark первую модель от Meta Superintelligence Labs Модель мультимодальная одновременно обрабатывает текст изображения и аудио Есть режим Contemplating Mode в котором несколько подагентов параллельно рассуждают над сложными задачами Уже доступна на meta ai и в мобильном приложении Google интегрировала NotebookLM прямо в Gemini Теперь можно упорядочивать несколько проектов и использовать предыдущие чаты Gemini в качестве источников для NotebookLM Пока доступно подписчикам AI Ultra Pro и Plus в ближайшие недели расширят доступ Stability AI представила Brand Studio платформу для создания визуального контента с учётом фирменного стиля Можно загрузить бренд гайдлайны цвета стиль композицию и система будет генерировать и редактировать изображения строго в рамках этих правил Есть автоматический подбор моделей под задачу и инструменты для командной работы Black Forest Labs выпустили FLUX 2 small decoder облегченный декодер для семейства моделей FLUX 2 Декодирует изображения примерно в 1 4 раза быстрее стандартного и требует в 1 4 раза меньше видеопамяти что позволяет работать с более высокими разрешениями Совместим со всеми открытыми моделями серии FLUX 2 дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ Alibaba выпустила Qwen3 5 Omni модель которая одновременно понимает текст изображения аудио и видео Можно описать идею голосом прямо в камеру и модель сгенерирует рабочий сайт или игру Умеет размечать видео с таймкодами распознает речь на 113 языках и обрабатывает до 10 часов аудио за раз Claude Code научился управлять компьютером прямо из командной строки Теперь агент может сам открывать приложения проверять интерфейс запускать сборки и отлаживать их в одном потоке Работает с десктопными приложениями и графическими интерфейсами OpenAI выпустила плагин который позволяет использовать Codex прямо внутри Claude Code Google представила Veo 3 1 Lite облегченную версию видеогенератора Стоит меньше половины от старшей версии Fast Генерирует видео из текста и из изображений в разрешении до 1080p длительностью 4 6 или 8 секунд PixVerse выпустил модель V6 Теперь можно создавать 15 секундные видео со звуком в 1080p Улучшены реалистичность движения детализация кожи и передача эмоций Добавлено кинематографическое управление камерой поддержка спецэффектов таймлапсов и многокадрового повествования Z AI представила AutoClaw приложение для запуска OpenClaw локально на своем компьютере Не требует API ключа работает сразу после установки Можно подключить любую модель или использовать встроенную GLM 5 Turbo Все данные хранятся локально и не покидают компьютер GLM представил GLM 5V Turbo модель которая превращает дизайн макеты и скриншоты в код Понимает изображения видео черновики дизайна и вёрстку документов Работает в связке с Claude Code и OpenClaw Google выпустила Gemma 4 новую модель для локальных устройств Модель мультимодальная распознает изображения видео и голос поэтому может работать как локальный голосовой помощник Код полностью открыт и разрешнн для коммерческого использования Microsoft запустила семейство моделей MAI MAI Transcribe 1 распознант речь на 25 языках и работает в 2 5 раза быстрее текущих решений Azure MAI Voice 1 генерирует естественную речь для голосовых агентов MAI Image 2 генерирует изображения и вошел в топ 3 мирового рейтинга Arena ai особенно хорошо справляясь с текстом внутри картинок и фотореализмом Alibaba выпустила Qwen 3 6 Plus Улучшены навыки программирования от фронтенда до работы с большими кодовыми базами Модель быстрее и надёжнее предыдущей версии Qwen 3 5 Cursor представил Cursor 3 с обновлннным интерфейсом Главное нововведение теперь можно одновременно запускать несколько ИИ агентов и распределять между ними задачи Агенты работают на локальном компьютере в облаке или на удаленном сервере дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ Anthropic добавила в Claude возможность управлять компьютером Claude теперь умеет открывать приложения работать в браузере заполнять таблицы взаимодействовать со Slack и календарем Если у приложения нет прямой интеграции Claude запросит разрешение и будет работать с ним напрямую через интерфейс Функция доступна в Claude Cowork и Claude Code для подписчиков Pro и Max пока только на macOS HeyGen представил бренд системы Достаточно указать URL сайта компании и HeyGen сам извлечёт логотип шрифты и цветовую палитру После этого бренд будет автоматически применяться ко всему что создается внутри платформы шаблонам проектам в AI Studio и видео сгенерированным через Video Agent Figma запустила открытую бету MCP инструмента use figma Теперь ИИ агенты смогут не только читать макеты в Figma но и редактировать их в реальном времени Агент сможет обновлять компоненты править Auto Layout и синхронизировать дизайн с кодом При этом агент будет использовать переменные и стили проекта как основу поэтому правки не сломают дизайн систему Функция доступна для платных тарифов В Claude Code появился автоматический режим Раньше Claude Code запрашивал подтверждение на каждое действие будь то изменение файла запуск команды или выбор разрешений Теперь можно включить режим в котором Claude будет принимать такие решения самостоятельно Google выпустила Lyria 3 Pro обновление модели генерации музыки Теперь нейросеть создаёт треки длиной до 3 минут Можно самостоятельно задать структуру песни вплоть до вступления куплетов припева и переходов Модель уже встроена в платную версию Gemini Google Vids и платформу ProducerAI CapCut представил CapCut Video Studio рабочее пространство на базе бесконечного холста с поддержкой модели генерации видео Dreamina Seedance 2 0 Внутри есть ИИ агент для придумывания идей и написания сценариев встроенная раскадровка для планирования сцен и полный набор инструментов для редактирования прямо на холсте Вышла Suno 5 5 Главное нововведение теперь можно загрузить шесть и более своих треков и нейросеть создаст персональную модель которая будет копировать стиль и звучание автора Вышел генератор изображений Phota Studio и Phota API Модель специализируется на работе с фотографиями реальных людей можно менять композицию освещение и позу создавать стилизованные портреты студийного качества восстанавливать размытые снимки и добавлять человека который не попал в кадр API позволяет встраивать эти возможности в свои приложения Meta выпустила TRIBE v2 модель которая предсказывает реакцию человеческого мозга на визуальные и звуковые раздражители Модель обучена на более чем 500 часах записей фМРТ функциональной магнитно резонансной томографии от 700 человек TRIBE v2 умеет прогнозировать какие области мозга активируются при просмотре видео прослушивании подкаста или чтении текста Модель может пригодиться в исследованиях неврологических заболеваний в проектировании архитектур ИИ на основе данных о работе мозга а также в развитии интерфейсов мозг компьютер Google выпустила Gemini 3 1 Flash Live отдельную модель для голосового общения обученную на базе Gemini 3 Pro Минимальная задержка отклика сократилась до 0 96 секунды Модель лучше распознает интонацию скорость речи и эмоции собеседника Контекстное окно удвоено до 128 000 токенов а также улучшено понимание команд в шумной среде Поддерживает более 90 языков и работает в более чем 200 странах дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ OpenAI выпустила две новые модели GPT 5 4 Mini и Nano Mini работает почти на уровне полноразмерной GPT 5 4 но быстрее и дешевле Поддерживает текст изображения вызов инструментов и контекст до 400 000 токенов Nano ещё компактнее и заточена под простые задачи и субагентов Обе доступны через API Cursor представил Composer 2 собственную модель для генерации кода По тестам она почти на уровне GPT 5 4 а в некоторых задачах обходит Claude Sonnet 4 6 при этом стоит дешевле Умеет работать с длинными цепочками действий и показывает высокие результаты на Terminal Bench 2 0 и SWE bench Multilingual Midjourney выпустила модель v8 Генерация стала примерно в пять раз быстрее улучшилось понимание сложных промптов и рендеринг текста на картинках Появился режим hd для рендеринга в 2K Но в комментариях пользователи массово жалуются проблемы с руками и согласованностью никуда не делись модерация стала строже а у части людей перестали адекватно работать sref стили Microsoft представила MAI Image 2 модель генерации изображений созданную при участии профессиональных фотографов и дизайнеров Модель уже вошла в топ 3 на рейтинге Arena ai Отдельно выделяют фотореализм с естественным освещением и надёжную генерацию текста внутри картинки Доступна через MAI Playground пока только для США и встраивается в Copilot и Bing Image Creator Mistral выпустил открытую модель Mistral Small 4 128 экспертов 119 миллиардов параметров контекстное окно 256К токенов лицензия Apache 2 0 Новый параметр reasoning effort позволяет на лету переключаться между быстрыми ответами и глубоким пошаговым рассуждением Работает на 40 быстрее предыдущего поколения с тройным приростом пропускной способности MiniMax представил открытую модель M2 7 На 88 самостоятельно обеспечила собственный апгрейд относительно прошлой версии В тесте SWE Pro набрала 56 22 и в ряде случаев сократила время исправления программных ошибок до 3 минут Google значительно обновил AI Studio Промпты теперь превращаются в полноценные приложения с базами данных аутентификацией через Firebase и интеграцией с внешними сервисами Агент Antigravity стал глубже понимать структуру проекта Добавили поддержку мультиплеерных приложений и фреймворка Next js Google обновил инструмент для дизайна интерфейсов Stitch Добавили голосовое управление менеджер агентов для параллельной работы мгновенную сборку интерактивных прототипов и систему DESIGN md для переноса стилей между проектами и ИИ сервисами На фоне анонса акции Figma упали на 8 8 Anthropic добавила в Claude Cowork функцию Проекты для хранения задач файлов и контекста в одном месте Также тестируют каналы Claude Code можно отправлять сообщения из Telegram Discord и iMessage прямо в активную сессию и продолжать работу с поддержкой MCP Anthropic запустила Dispatch для Claude Cowork Можно отправлять задачи Claude Desktop с телефона и возвращаться к готовому результату По сути это постоянная сессия Claude на компьютере доступная удаленно Пока для подписчиков Max позже появится на Pro Manus запустила My Computer десктопное приложение которое переносит ИИ агента из облака на локальный компьютер Агент может выполнять команды терминала читать и редактировать файлы запускать настольные приложения Доступно на macOS и Windows Lovable добавил агента который запускает скрипты делает вычисления и работает с файлами Можно загрузить CSV или PDF и получить анализ сгенерировать отчет или презентацию преобразовать спецификацию в приложение с интерфейсом и логикой Всё в одном чате Gamma выпустила Gamma Imagine генерацию визуальных элементов прямо внутри платформы плакаты логотипы инфографика из одного запроса Обновили шаблоны теперь можно менять всю презентацию одним запросом с сохранением бренда и стиля Gamma теперь интегрирована в ChatGPT Claude Make и другие сервисы дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ OpenAI выпустила GPT 5 4 модель которая объединяет рассуждения программирование и агентские задачи в одну систему Раньше для каждого из этих направлений нужны были разные подходы теперь все работает внутри одной модели Главная фишка GPT 5 4 умеет менять направление мысли на лету если в процессе ответа понимает что пошла не туда В тесте GDPval который имитирует реальную офисную работу в 44 сферах модель справляется с задачами в 83 случаев предыдущая версия набирала 71 OpenAI также внедрила GPT 5 3 Instant для всех пользователей ChatGPT Улучшены отображение результатов поиска точность ответов и естественность диалога Модель меньше отказывается от запросов не перегружает ответы лишними оговорками и звучит менее формально Google выпустила Gemini 3 1 Flash Lite самую экономичную модель серии Gemini 3 Скорость отклика примерно в 2 5 раза выше чем у Gemini 2 5 Flash а производительность на 45 больше При этом цена минимальная 0 25 за миллион входных токенов и 1 50 за миллион выходных Qwen представила серию компактных моделей Qwen 3 5 в четырех размерах 0 8B 2B 4B и 9B параметров Самые маленькие версии на 0 8B и 2B рассчитаны на работу прямо в смартфонах и гаджетах Версия на 4B подходит для цифровых помощников Старшая модель на 9B по качеству ответов почти не уступает большим нейросетям при этом требует значительно меньше вычислительных ресурсов OpenAI запустила Codex на Windows Приложение поддерживает локальное выполнение кода и интеграцию с WSL Встроены терминалы PowerShell CMD и Git Bash NotebookLM от Google научился создавать кинематографические видеообзоры из загруженных источников Можно выбрать сюжетную линию и NotebookLM сгенерирует видеоролик на основе материалов Пока доступно на английском языке для подписчиков Ultra Lightricks выпустила видеомодель LTX 2 3 которая генерирует видео в разрешении до 4K со встроенным озвучиванием диалогов Модель точнее интерпретирует движения камеры и действия персонажей стабильнее рендерит текст на вывесках и элементах интерфейса поддерживает вертикальный формат для соцсетей и позволяет задавать стартовый и конечный кадры для построения переходов между сценами Utopai Studios представила модель PAI для создания полнометражных видео Модель генерирует последовательности до 16 сцен общей длительностью до минуты в разрешении 4K при этом сохраняет стабильность персонажей и окружения от кадра к кадру Можно вносить правки в отдельные части видео через текстовые команды не перегенерируя ролик целиком Higgsfield представил Higgsfield Audio генератор аудио на основе ИИ Умеет озвучивать текст с помощью 21 предустановленного голоса заменять голос в любом видео и переводить речь на 10 языков включая русский с синхронизацией губ Можно клонировать собственный голос загрузив аудиофайл длительностью до 2 минут Luma представила Creative Agents систему которая превращает платформу из генератора видео в автономную креативную команду Можно поручить агентам создать целую рекламную кампанию и они автоматически задействуют модели Sora 2 Veo 3 1 Kling ElevenLabs и другие для генерации видео изображений и аудио в едином рабочем пространстве Система поддерживает единый контекст бренда во всех материалах дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ Anthropic выпустила Claude Sonnet 4 6 Модель приближается к уровню Opus но стоит значительно дешевле Улучшения в программировании работе с длинным контекстом планировании агентов и проектировании В бета версии доступно контекстное окно на 1 миллион токенов Бесплатный тариф тоже обновили до Sonnet 4 6 и добавили в него создание файлов коннекторы и навыки Google выкатила Gemini 3 1 Pro На бенчмарке ARC AGI 2 модель набрала 77 1 это более чем вдвое лучше предыдущей версии Умеет генерировать анимированные SVG из текста строить живые дашборды с подключением к данным в реальном времени и кодировать 3D симуляции Доступна в Gemini App NotebookLM Google AI Studio и Android Studio xAI выпустила Grok 4 20 в бета версии Главная фишка система из четырёх агентов которые думают параллельно и обсуждают задачу между собой прежде чем дать ответ Один отвечает за креативный синтез второй за глубокое исследование третий за техническую часть четвёртый за проверку ошибок Alibaba выпустила открытую модель Qwen 3 5 на 397 миллиардов параметров Модель заточена под работу визуальным агентом понимает что происходит на экране видит элементы интерфейса и сама выполняет действия в приложениях На 60 дешевле предыдущей версии и в 8 раз быстрее на больших объёмах данных По качеству сравнима с Gemini 3 Pro Вышел Recraft V4 модель генерации изображений для дизайнеров Делали вместе с дизайнерами под реальные задачи композиция свет типографика встроенная в картинку генерация редактируемых SVG векторов прямо из промпта Две версии V4 для быстрых генераций до 10 секунд и V4 Pro для высокого разрешения и печати Google DeepMind представила Lyria 3 новую модель для генерации музыки Теперь в приложении Gemini можно создавать треки по текстовому описанию или по загруженному изображению Постепенный глобальный запуск на десктопе и мобильных устройствах Figma запустила MCP плагин для Claude Code Теперь сгенерированный код можно отправить в Figma командой Send this to Figma и он отрендерится в виде редактируемых слоёв на дизайн холсте Claude Code получил обновление Теперь можно предварительно просматривать запущенные приложения проверять код и обрабатывать ошибки CI в фоновом режиме После создания PR доступно автоматическое исправление ошибок Сессии можно переносить из терминала на десктоп или в облако Manus представил Manus Agents возможность использовать Manus прямо в мессенджерах Агент запоминает стиль и предпочтения умеет создавать видео слайды сайты и изображения из одного сообщения Подключается к Gmail календарю и Notion Пока доступно в Telegram Rork выпустил Rork Max приложение для создания приложений и игр под все устройства Apple iPhone iPad Apple Watch Apple TV и Vision Pro Работает на базе Swift Claude Code и Opus 4 6 публикация в App Store в несколько кликов ElevenLabs добавила инструмент Experiments для голосовых агентов Теперь можно проводить A B тесты конфигураций агентов на реальных звонках сравнивать разные промпты модели и голоса с распределением трафика и аналитикой в реальном времени PolyAI запустила Agent Studio Lite инструмент который создаёт голосового агента для бизнеса просто проанализировав сайт компании Рабочий прототип будет готов за 5 минут поддерживает больше 45 языков Replit выпустил Replit Animation на базе Gemini 3 1 Pro Можно создавать анимированные видео просто описав их текстом Доступно прямо на сайте Replit во вкладке Приложение дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ Google выпустила крупное обновление Gemini 3 Deep Think Теперь модель работает как полноценный научный сотрудник находит ошибки в научных статьях моделирует физические процессы через код превращает эскизы в 3D модели для печати На тесте Humanity s Last Exam набрала 48 4 без инструментов это новый рекорд MiniMax запустила модель агента M2 5 которая конкурирует с Opus 4 6 GPT 5 2 и Gemini 3 По SWE Bench тест на написание кода набрала 80 2 по BrowseComp поиск информации 76 3 по BFCL работа с агентами 76 8 Работает на 37 быстрее конкурентов в сложных задачах и стоит около доллара в час Z ai выпустила открытую языковую модель GLM 5 на 744 миллиарда параметров Модель использует архитектуру Mixture of Experts когда активна только часть параметров что делает её эффективнее и обучена на 28 5 триллионах токенов По тестам приближается к Claude Opus 4 5 и умеет работать с документами формата docx и xlsx ElevenLabs добавила инструменты для создания аудиокниг Теперь в ElevenCreative можно озвучить книгу от первого черновика до публикации выбрать голоса настроить режиссуру по сценам и опубликовать результат напрямую в ElevenReader Qwen выпустила модель генерации изображений Qwen Image 2 0 Модель поддерживает разрешение 2K умеет рендерить текст на изображениях и генерировать слайды плакаты и комиксы с промптами до 1 000 токенов Claude Cowork стал доступен на Windows Функционал такой же как на macOS доступ к файлам многоуровневые задачи подключаемые модули и MCP коннекторы Можно задавать глобальные правила или правила для отдельных папок Пока в режиме предварительного просмотра доступен всем платным пользователям Google Stitch добавил экспорт проектов в Figma Дизайн созданный в Stitch теперь можно перенести в Figma в один клик и продолжить редактировать макет Если использовать Redesign Agent проект также можно сконвертировать в код Вышел Orchids 1 0 ИИ агент для создания приложений на любой платформе веб мобильные приложения расширения для Chrome боты в Slack Работает с существующими подписками на ChatGPT Claude Code GitHub Copilot и Gemini поэтому модели используются по себестоимости без дополнительных наценок LTX Studio представил Brand Kit функцию для команд которая позволяет загрузить элементы бренда в одно место и использовать их при создании проектов Все участники команды работают с одними и теми же логотипами шрифтами и стилями дайджесты neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ Anthropic выпустил Claude Opus 4 6 Модель лучше планирует дольше работает над задачами без участия человека увереннее ориентируется в больших кодовых базах и находит собственные ошибки Впервые для моделей класса Opus доступно контекстное окно на 1 миллион токенов В тестах обошла GPT 5 2 по бизнес задачам и показала лучший результат в Terminal Bench 2 0 по агентскому программированию OpenAI ответила моделью GPT 5 3 Codex и выпустила десктопное приложение для macOS Codex умеет вести несколько задач параллельно один экземпляр может чинить баги другой писать новые функции а третий рефакторить старый код Каждый работает с изолированной копией поэтому сбой одного не ломает остальное Есть система навыков можно задать стандарты кодирования и процессы команды сохранить их и использовать на всех платформах Доступно для подписчиков Plus Pro Business Enterprise и Edu Perplexity обновил Deep Research Обновление работает на базе Claude Opus 4 5 и объединяет лучшие модели с фирменной поисковой системой Perplexity Для оценки качества команда выкатила собственный бенчмарк DRACO который проверяет 100 заданий в 10 областях от юриспруденции и медицины до шопинга По результатам этого бенчмарка Perplexity обошел всех конкурентов Пока доступно для подписчиков Max скоро появится на Pro ElevenLabs выпустила третью версию своей модели озвучки Основные улучшения на 68 меньше ошибок в числах символах и технической нотации быстрее генерация и ниже задержка Разработчики пишут что модель стабильнее работает в продакшене и готова к интеграции в приложения и агентов Вышла модель генерации музыки ACE Step v1 5 с открытым исходным кодом На видеокарте A100 генерирует полную песню меньше чем за 2 секунды на RTX 3090 укладывается в 10 секунд Поддерживает треки длительностью от 10 секунд до 10 минут и работает с видеопамятью от 4 ГБ Умеет создавать каверы разделять аудио на отдельные дорожки и генерировать аккомпанемент к вокалу Можно натренировать собственный стиль за час всего на 8 песнях Kling AI выпустила модель Kling 3 0 и перешла от генератора видео к полноценной системе создания контента Модель генерирует 15 секундные клипы с точным управлением поддерживает добавление нескольких объектов из изображений или видео и сохраняет согласованность персонажей между кадрами Улучшена встроенная озвучка больше языков акцентов и поддержка нескольких персонажей Изображения теперь выводятся в разрешении 4K LovartAI выпустил Lovart Skills функцию автоматизации дизайна Достаточно выбрать нужный результат и агент сам пройднт весь путь от идеи до финального макета подберет модели применит стили и доведёт до готового результата без промптов дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Что нового в мире ИИ Прошла всего одна рабочая неделя а новостей столько что книгу можно писать Давайте разбираться Black Forest выпустил FLUX 2 klein самые быстрые модели для генерации и редактирования изображений Картинка создаётся меньше чем за полсекунды Можно загружать до 10 референсов чтобы модель сохраняла нужный стиль или персонажа на разных изображениях Версия на 4B параметров полностью открытая и запускается на видеокартах уровня RTX 3090 и выше Mugen3D выпустили модель которая генерирует 3D модели кинематографического качества из обычных изображений Загружаете картинку модель автоматически рассчитывает форму объекта глубину текстуру и освещение Результат можно сразу импортировать в Unreal Engine Unity или WebGL Anthropic представил Claude Cowork инструмент для тех кто хочет делегировать нейросети длинные многоэтапные задачи Claude сам планирует работу выполняет её и корректирует по ходу Работает с файлами исследованиями текстами и рабочими процессами прямо в десктопном приложении Пока доступен только подписчикам Claude Max на macOS Anthropic также расширил возможности Claude для медицины и науки Теперь можно безопасно работать с медицинскими данными подключать персональные источники вроде Apple Health и использовать интеграции с научными платформами для анализа публикаций и планирования исследований Всё работает на базе Claude Opus 4 5 PixVerse запустил R1 модель которая генерирует видео в реальном времени и позволяет менять происходящее на лету через текстовые команды Пока доступны три темы на выбор но скоро обещают расширить до шести и добавить возможность создавать свои Для теста нужен инвайт код Higgsfield выпустил Mixed Media функцию для стилизации видео Загружаете любой материал и превращаете его в один из 30 кинематографических стилей от эскизной графики до винтажной плёнки Поддерживает разрешение до 4K и позволяет отдельно управлять цветом фона среднего слоя и объектов Manus добавил Meeting Minutes автоматическую расшифровку встреч Записываете разговор или просто надиктовываете свои мысли а агент выдаёт структурированную сводку с ключевыми моментами и списком задач Поддерживает русский язык работает в веб версии и мобильном приложении Google обновил Veo 3 1 Добавили вертикальный формат для создания роликов под YouTube Shorts улучшили качество до 4K и научили модель сохранять последовательность персонажей если загружать референсные изображения Доступно во Flow Gemini Vertex и API Google запустил Personal Intelligence функцию которая связывает Gemini с вашими Gmail Фото YouTube и Поиском Теперь нейросеть может планировать поездки на основе писем из почты предлагать идеи на основе ваших фотографий или учитывать недавние занятия в рекомендациях Функция выключена по умолчанию подключать приложения можно выборочно Пока доступно в США для подписчиков AI Pro и Ultra Alibaba выпустил CosyVoice 3 модель для генерации озвучки и клонирования голоса Достаточно 3 10 секунд аудио чтобы модель воспроизвела тембр и манеру речи Работает в стриминге с задержкой около 150 мс поддерживает русский язык и запускается локально даже на слабом железе Google выпустил TranslateGemma модели перевода с открытым исходным кодом Поддерживают 55 языков доступны в трех размерах и умеют переводить текст прямо с изображений Интересно что модель на 12B параметров работает быстрее и точнее чем версия на 27B OpenAI запустил подписку Go за 8 в месяц Это промежуточный вариант между бесплатным тарифом и Plus больше сообщений больше генераций изображений расширенная память А ещё компания анонсировала тестирование рекламы в бесплатном тарифе и Go Обещают что реклама не будет влиять на ответы и переписки останутся недоступны для рекламодателей дайджест neurozeh
Открыть в Telegram → Открыть новость на сайте →
Аватар
Black Forest Labs выпустили FLUX 2 klein Это новая быстрая модель для создания изображений Картинки генерируется меньше чем за секунду при этом качество остается на высоком уровне Модель подойдет для экспериментов со стилями и первичной проработки идей Доступны две версии Klein 4B и Klein 9B Первую можно использовать в коммерческих проектах без ограничений вторую можно скачать и дообучить под свои задачи но для коммерции нужна лицензия Можно работать через API или запустить локально на своем железе Есть бесплатная демка чтобы потестировать перед использованием Тестить тут HF Демо BFL Демо HF 9B Демо HF 4B новости neurozeh
Открыть в Telegram → Открыть новость на сайте →