Аватар автора

aihubvk

tech

1041 Подписчиков
12 Сообщений
7 Показано сообщений
Не указана Дата добавления
ГлавнаяАвторыaihubvk

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
Alibaba выпустила Qwen 3 5 eng ru Alibaba представила новое поколение мультимодальных моделей Qwen 3 5 флагман Qwen3 5 397B A17B заявлен на уровне GPT 5 2 Claude 4 5 Opus и Gemini 3 Pro работает в 8 раз быстрее предшественника поддерживает 201 язык и agent style выполнение действий в приложениях Облачная версия модели Qwen3 5 Plus получила 1M токенов контекста а Qwen3 5 397B A17B выложена на Hugging Face Anthropic представила Claude Sonnet 4 6 eng ru Обновлённый Sonnet усилили в кодинге long context reasoning и следовании инструкциям контекст расширен до 1 млн токенов Внутри Claude Code пользователи выбирали 4 6 вместо 4 5 примерно в 70 случаев апдейт ориентирован на практическое использование Google представил Gemini 3 Deep Think eng ru Версия Gemini для научных и исследовательских задач с акцентом на продвинутый reasoning на её базе создан агент Aletheia для проверки гипотез на естественном языке Модель набрала 48 4 на Humanity s Last Exam и 84 6 на ARC AGI 2 один из лучших результатов в задачах на обобщённое мышление MiniMax выпустила M2 5 eng ru MoE модель на 229B 10B active с контекстом 204k токенов оптимизированная под кодинг и tool use В тестах сопоставима с Claude Opus 4 5 и местами превосходит 4 6 при сопоставимой скорости доступна на Hugging Face В ChatGPT появился Lockdown Mode eng ru OpenAI добавила режим защиты от prompt injection и утечек чат работает с сохранёнными копиями сайтов без выхода в интернет часть инструментов можно отключить Функция ориентирована на enterprise сценарии и доступна в корпоративных тарифах Китай усиливает регулирование AI контента eng Регулятор удалил более 543 тыс публикаций и заблокировал 13 тыс аккаунтов за вредоносный и непомеченный ИИ контент сигнал о дальнейшем ужесточении требований к генеративным моделям и маркировке дайджест aivk
Открыть в Telegram → Открыть новость на сайте →
Аватар
Alibaba обновила Qwen3 Max Thinking eng ru Крупное обновление флагманской рассуждающей модели По 19 бенчмаркам Qwen3 Max Thinking показывает уровень сопоставимый с GPT 5 2 Thinking и Gemini 3 Pro Модель получила авто выбор инструментов сама решает когда подключать веб поиск память прошлых диалогов или интерпретатор кода Доступна бесплатно на chat qwen ai и через API Moonshot AI выпустила Kimi K2 5 eng ru Открытая мультимодальная модель заточенная под кодинг и агентные сценарии K2 5 умеет писать и отлаживать код по изображениям и видео например восстанавливать интерфейсы по скринкастам Новый режим Agent Swarm позволяет запускать до сотни параллельных субагентов В Thinking режиме модель лидирует в визуальных бенчмарках но уступает топам в классическом reasoning DeepSeek представила DeepSeek OCR 2 eng ru OCR модель на 3 млрд параметров с фокусом на понимание структуры документов По внутренним тестам версия 2 улучшила качество на 4 относительно предыдущей и обходит Gemini 3 Pro в бенчмарках для сложных документов таблицы формы многостраничные PDF Доступна на Hugging Face Google запустил Agentic Vision в Gemini 3 Flash eng ru Новая функция для детального анализа изображений Модель сначала строит план действий затем генерирует Python код для обработки изображения обрезка поворот аннотации разметка По данным Google включение code execution даёт стабильный прирост 5 10 на визуальных бенчмарках Бета доступна бесплатно в Google AI Studio Vertex AI и через API Apple и OpenAI разрабатывают носимые ИИ гаджеты eng ru Apple работает над носимым ИИ устройством размером с AirTag с двумя камерами и тремя микрофонами Запуск ожидается в 2027 году планируемый тираж 20 млн устройств Параллельно OpenAI разрабатывает собственный носимый ИИ девайс с камерой и микрофоном для контекстного взаимодействия по слухам в формате ручки или наушников Moltbot персональный ИИ агент в мессенджерах eng ru Open source ИИ помощник работающий локально или в облаке и интегрирующийся с сервисами вроде Gmail и GitHub Управляется через Telegram WhatsApp и другие мессенджеры может работать с файлами календарём заказами и даже писать в групповые чаты от имени пользователя Разработчик предупреждает о повышенных рисках безопасности из за широких полномочий агента OpenAI выпустила Prism для научных исследований eng ru Prism рабочее пространство для исследователей на базе GPT 5 2 Thinking Поддерживает редактирование и форматирование научных текстов генерацию диаграмм поиск литературы и автоматическую сборку библиографии Есть режим совместной работы Доступен бесплатно всем пользователям ChatGPT Anthropic добавляет интеграции сторонних сервисов в Claude eng ru Claude получил встроенные интеграции со Slack Canva Figma Box и Clay Пользователи могут отправлять сообщения работать с дизайнами и файлами прямо из чата без переключения между сервисами Функция доступна на тарифах Pro Max Team и Enterprise ответ Anthropic на экосистему OpenAI OpenAI планирует продавать рекламу в ChatGPT по 60 CPM ru По данным The Information стоимость рекламы в ChatGPT составит 60 за 1000 показов почти втрое дороже стандартной рекламы в Meta При этом рекламодателям будут доступны только агрегированные метрики показы клики без данных о конверсиях и покупках Компания Meta признана в России экстремистской организацией её деятельность запрещена дайджест aivk
Открыть в Telegram → Открыть новость на сайте →
Аватар
Google запустил Nano Banana Pro eng ru Новая версия мультимодели на базе Gemini 3 Pro поддержка 4K до 14 изображений при редактировании и сохранение портретного сходства нескольких людей Модель умеет искать изображения в вебе и использовать их при генерации Улучшено качество текста включая русский Все картинки помечаются SynthID Anthropic представил Claude Opus 4 5 eng ru Флагманская модель улучшила результаты в кодинге Excel аналитике и агентных сценариях Впервые добавлена функция бесконечного чата память сжимается без разрыва диалога Лидер на SWE bench Verified и в тестах на устойчивость к атакам Black Forest Labs представила FLUX 2 eng ru Модели генерации изображений с поддержкой до 10 входных фото 4K разрешения и корректным отображением текста Полная версия требует 90 ГБ VRAM FP8 вариант снижает память на 40 Есть опенсорс версия на Hugging Face Режим Исследование покупок в ChatGPT eng ru Новая функция на базе GPT 5 mini уточняет запросы и подбирает товары работает как Deep Research для шопинга Доступна всем пользователям Meta выпустила SAM3 модель сегментации eng ru Распознаёт и отслеживает объекты в фото и видео понимает текстовые команды выдели жёлтый автобус создаёт 3D реконструкции по одному снимку Применяется для подсветки объектов трекинга и размытия лиц Доступна на Hugging Face Компания Meta признана в России экстремистской организацией её деятельность запрещена АФТ и Альянс в сфере ИИ представили методологию оценки эффекта от AI ru Документ стандартизирует подход к измерению выгоды от AI проектов рост доходов снижение расходов оптимизация штата управление рисками Включает метрики и методы от рандомизированных экспериментов до альтернативного моделирования Новая статья от инженеров VK на Хабр Датасет VK LSVD помогает тестировать алгоритмы рекомендаций сейчас на его базе проходит VK RecSys Challenge дайджест aivk
Открыть в Telegram → Открыть новость на сайте →
Аватар
OpenAI выпустила GPT 5 1 eng ru Две версии GPT 5 1 Instant и GPT 5 1 Thinking Первая теплее и лучше следует инструкциям вторая быстрее и настойчивее при сложных задачах Добавлены настройки персонализации тон краткость использование эмодзи Старые версии будут доступны ещё 3 месяца Moonshot AI представила Kimi K2 Thinking eng ru Рассуждающая модель на 1 трлн параметров 32 активных контекст 256K токенов Лидирует в тесте Humanity s Last Exam HLE и сопоставима с GPT 5 и Claude 4 5 Весовые параметры открыты приведены результаты бенчмарков Baidu выложила ERNIE 4 5 VL 28B A3B Thinking eng ru Мультимодальная модель для анализа изображений и рассуждений на уровне SOTA Умеет динамически масштабировать картинки и анализировать диаграммы Доступна на Hugging Face Apache 2 0 ElevenLabs представила Scribe v2 Realtime eng ru Модель преобразует речь в текст с задержкой 150 мс поддерживает 90 языков включая русский и точность 93 5 Оптимизирована для ассистентов и субтитров Доступна через API MAI Image 1 от Microsoft теперь в Bing Image Creator и Copilot Audio Expressions eng ru Фотореалистичная модель для генерации изображений теперь создаёт иллюстрации и для аудиороликов в Copilot Отличается высокой скоростью и качеством света и текстур Массовые увольнения не связаны напрямую с ИИ eng Amazon Intel Microsoft и другие сокращают штат ради рентабельности а не из за ИИ автоматизации 80 компаний уже используют генеративный ИИ но прибыль пока не выросла Apple заплатит Google 1 млрд в год за ИИ для Siri eng ru Siri перейдёт на модель Gemini 1 2T в 2026 году Обработка данных через Apple Private Cloud Compute без доступа Google В будущем Apple готовит собственную триллионную модель Суд поддержал Stability AI в деле против Getty Images eng ru Британский суд признал что Stable Diffusion не хранит и не воспроизводит защищённые изображения Решение создаёт прецедент для будущих дел о тренинге моделей на контенте дайджест aivk
Открыть в Telegram → Открыть новость на сайте →
Аватар
MiniMax представила модель для кода и агентов MiniMax M2 eng ru Открытая MoE модель 230B из них 10B активных создана для программирования и AI агентов По бенчмаркам входит в число лучших опенсорс моделей для кода обгоняя Claude Gemini и GLM Google запустил Pomelli для маркетинга eng ru Генеративный сервис для бренд контента создаёт визуальный стиль компании и генерирует кампании постеры и макеты Сейчас в бете в США Канаде Австралии и Новой Зеландии ChatGPT добавил Shared Projects eng ru Теперь можно делиться проектами по ссылке совместно редактировать чаты файлы и код использовать голос и поиск Функция доступна всем пользователям с 24 октября Alibaba представила Quark AI Glasses eng ru Умные очки с голосовым ассистентом на базе Qwen поддержка звонков перевода транскрибации музыки и камеры Стоимость около 660 Конкурент Meta Ray Ban Glasses Meta и Hugging Face выпустили OpenEnv eng ru Открытая среда для создания и обучения AI агентов Включает плагины API инструменты для RL обучения и будущие интеграции с TRL SkyRL и Unsloth Компания Meta признана в России экстремистской организацией её деятельность запрещена Anthropic арендует 1 млн TPU у Google eng ru Контракт на десятки миллиардов долларов обеспечит Anthropic вычислительные мощности 1 ГВт с 2026 года Google укрепляет позиции на рынке AI чипов против Nvidia и AMD дайджест aivk
Открыть в Telegram → Открыть новость на сайте →
Аватар
Microsoft представила MAI Image 1 eng ru Первая генеративная модель изображений от Microsoft AI Создаёт фотореалистичные сцены с проработанным освещением и отражениями работает быстрее конкурентов Уже в топ 10 LMArena и скоро появится в Copilot и Bing Image Creator Google интегрирует Nano Banana в Lens и NotebookLM eng ru Модель для обработки изображений теперь в поиске Google Photos и NotebookLM Позволяет генерировать контекстные картинки и короткие сводки в формате Brief Perplexity стал поиском в Firefox eng ru Mozilla добавила движок Perplexity в Firefox можно активировать из адресной строки или сделать поиском по умолчанию Мобильная версия появится позже Google запустила Режим ИИ в России ru Новый AI Mode доступен на главной странице Google развёрнутые ответы на запросы с возможностью уточнений Основан на моделях Gemini 2 5 UserLM 8B модель симуляции диалога от Microsoft eng ru Создана на базе Llama 3 1 8B для имитации поведения человека в общении уточнения эмоции смена мнения Обучена на корпусе WildChat 1M Превосходит аналоги по естественности и разнообразию Доступна на Hugging Face PyMC Labs заменили фокус группы LLM моделями eng ru LLM имитировали покупателей и оценивали продукт результаты совпали с реальными опросами на 90 Метод можно применять для тестирования маркетинговых гипотез OpenAI и Broadcom создают ИИ чипы eng ru Партнёрство на 10 ГВт мощностей с 2026 по 2029 год Цель снизить зависимость от Nvidia Broadcom ожидает прибыль не раньше 2029 года дайджест aivk
Открыть в Telegram → Открыть новость на сайте →
Аватар
VK выпустила датасет VK LSVD Large Short Video Dataset для развития рекомендательных систем Исследователи AI VK открыли доступ к масштабному датасету VK LSVD для развития рекомендательных систем В нём собраны 40 млрд обезличенных взаимодействий пользователей с короткими видео январь июнь 2025 20 млн роликов с метаданными и эмбеддингами а также данные о 10 млн пользователей с соцдем признаками Формат коротких видео удобен для исследований много фидбека за сессию чёткая атрибуция реакций и высокая корреляция оффлайн оценок с онлайном VK LSVD позволяет гибко формировать выборку под конкретные задачи и доступные мощности что делает его полезным как для академических исследований так и для индустриальных экспериментов Датасет уже доступен по ссылке а скоро на его базе пройдёт открытое соревнование для инженеров Gemini 2 5 Flash Image новая модель Google для создания и редактирования изображений eng ru Gemini 2 5 Flash Image появившаяся под промо именем Nano Banana заняла первые места на LMArena в ряде категорий включая общую производительность креативность инфографику и работу с персонажами и объектами Модель принимает на вход как текст так и изображения можно подать несколько картинок Пользователи отмечают хорошую работу модели со шрифтами и качественное комбинирование нескольких изображений в одно Модель доступна через Gemini API и Google AI Studio а также бесплатно через Gemini App Бенчмарк MPC Universe от Salesforce для тестирования навыков работы LLM с MCP серверами eng Компания Salesforce разработала бенчмарк на котором можно протестировать насколько LLM хорошо справляется с задачами требующими использования MCP Авторы собрали 231 задачу из 6 разных доменов навигация по картам управление репозиториями с кодом финансовый анализ 3D проектирование автоматизация браузера и веб поиск Часть задач требует многократного обращения к MCP серверу т е модель должна хорошо уметь работать с длинным контекстом Результаты показали что GPT 5 лидирует с большим отрывом но справляется при этом менее чем с 50 задач Лучшей опенсорсной моделью оказалась GLM 4 5 ZenFlow новый движок для обучения LLM без простоев GPU от PyTorch eng ZenFlow это новое расширение традиционного фреймворка DeepSeed Решение сокращает время простоя GPU при обучении LLM на 85 разделяя градиенты по важности приоритетные обновляются сразу на GPU остальные асинхронно на CPU пока графический процессор занят градиенты из текущей или предыдущей итерации передаются на CPU по выделенному потоку PCIe Такой подход с полным перекрытием всех операций ускоряет обучение в среднем в 5 раз по сравнению с DeepSpeed ZeRO Offload Решение доступно на GitHub Grok Code Fast 1 быстрая и экономичная модель для генерации кода от xAI eng ru xAI выпустил новую модель Grok Code Fast 1 для кодирования Модель на 314 миллиардов параметров поддерживает контекст до 256К токенов и может генерировать до 92 токенов в секунду Разработчики позиционируют модель как инструмент решения базовых задач разработки она отлично подойдет например для создания веб приложений и быстрой разработки прототипов Стоимость модели составляет всего 0 2 за 1 млн входных токенов и 1 5 за 1 млн выходных Alibaba анонсировал платформу Qoder сервис для написания кода при помощи ИИ eng ru В Qoder доступно два режима работы Agent Mode и Quest Mode В Agent Mode платформа Qoder выступает в роли помощника по написанию кода что подойдет для базовых задач и быстрых правок В режиме Quest Mode помощник Qoder автономно работает с кодовыми базами по развёрнутому техзаданию Qoder составляет план работы отмечает выполненные задачи в to do листе автоматизирует тестирование и валидацию может составить документацию по уже существующим проектам Система поддерживает MCP Новый инструмент пополняет ряды IDE с ИИ и конкурирует с другими системами такими как Cursor и Windsurf На период беты Qoder доступен полностью бесплатно дайджест aivk
Открыть в Telegram → Открыть новость на сайте →
1