Machinelearning
29.08.2025 13:03
Ещё один любопытный спортивный робот на этот раз от UC Berkeley Инженеры показали гуманоида играющего в настольный теннис и способного отбить 106 ударов подряд Работает полностью автономно без телоуправления Планировщик прогнозирует траекторию мяча и выбирает точку время и скорость удара Контроллер на основе RL превращает план в согласованные движения рук и ног удерживая баланс при замахе Обучение основано на видео с реальных матчей поэтому удары выглядят естественно а не роботизировано Контур управления работает быстрее секунды что позволяет вести долгие розыгрыши без сбоев ai machinelearning big data Berkeley robots
Machinelearning
29.08.2025 05:29
Microsoft AI представила первые полностью собственные ИИ модели Корпорация анонсировала 2 новые модели разработанные полностью внутри компании MAI Voice 1 для синтеза речи и большую языковую модель MAI 1 preview Разработку возглавляет Мустафа Сулейман сооснователь DeepMind который теперь руководит подразделением Microsoft AI Модель MAI Voice 1 может генерировать минуту высококачественного аудио менее чем за секунду на одном GPU Она уже используется в некоторых функциях Copilot и доступна для тестирования разработчиками MAI 1 preview первая собственная фундаментальная языковая модель Microsoft Она уже проходит тестирование на LMArena и в ближайшие недели ее начнут интегрировать в отдельные функции Copilot Внешним разработчикам также предоставят ранний доступ microsoft ai Copilot появился на телевизорах и мониторах Samsung Microsoft интегрировала Copilot в линейки Neo QLED OLED и The Frame телевизоров и мониторов Samsung Ассистент доступен через операционную систему Tizen в интерфейсе Samsung Daily и активируется кнопкой микрофона на пульте Пользователи могут задавать вопросы получать рекомендации и искать информацию о фильмах Ответы предоставляются в виде голосовых реплик и визуальных карточек с изображениями и рейтингами На экране появляется анимированный персонаж синхронизирующий мимику с разговором Функция бесплатна но на старте доступна только в некоторых регионах microsoft com Google открыла бесплатный доступ к ИИ видеоредактору Vids Google сделала Vids доступным для всех владельцев аккаунтов Google Ранее инструмент был эксклюзивом для подписчиков Workspace Бесплатная версия включает базовые шаблоны доступ к стоковым медиа и часть ИИ возможностей Одновременно с этим подписчики Workspace и Google AI получили новые премиум функции image to video на базе Veo 3 фотореалистичные ИИ аватары способные зачитывать текст пользователя и функция автоматической обрезки которая убирает паузы и слова паразиты из записанной речи В будущем появятся функции шумоподавления и поддержка вертикальных форматов кадра workspace google com Anthropic начнет обучать модели Claude на данных пользователей Компания объявила о кардинальном изменении своей политики конфиденциальности Теперь данные из чатов и сессий кодирования пользователей будут использоваться для обучения ИИ моделей компании а срок их хранения увеличится до 5 лет Новые правила вступают в силу 28 сентября Изменение коснется всех потребительских тарифов Claude включая бесплатный При этом оно не затронет корпоративные и образовательные планы а также использование через API Пользователям будет предложено сделать выбор во всплывающем окне Важно отметить что опция разрешающая использование данных включена по умолчанию Хотя решение можно будет изменить в любой момент в настройках это не будет иметь обратной силы для уже собранных данных anthropic com Исследование люди начали использовать в речи слова характерные для ChatGPT В Университете штата Флорида провели исследование 22 миллионов слов из подкастов и спонтанной речи и обнаружили статистически значимый рост употребления терминов которые часто используют большие языковые модели в частности ChatGPT С момента публичного запуска чат бота в конце 2022 года частота использования слов surpass boast meticulous и strategically выросла более чем вдвое В то же время частота их синонимов не популярных у ИИ не изменилась Исследователи отмечают что впервые в новейшей истории лингвистики наблюдается столь быстрый и масштабный сдвиг в словарном запасе вызванный нечеловеческим фактором news fsu edu ai machinelearning big data news ai ml
Machinelearning
28.08.2025 15:46
Новое решение на базе ИИ сможет анализировать снимки МРТ мозга младенцев за несколько минут вместо нескольких дней Нейросеть созданная Яндексом совместно со студентами ШАДа и экспертами СПбГПМУ поможет улучшить качество диагнозов и повысит точность и скорость диагностики ДЦП и нарушений развития нервной системы на ранней стадии Как правило ручная расшифровка снимков МРТ занимает у врачей до 72 часов В случае если это не первое исследование то срок может увеличиться Новый веб сервис оценивает развитие мозга новорожденных за минуты сокращая время анализа в десятки раз и позволяя врачам выбрать наиболее эффективную терапию для ребенка Техническая реализация Использовали 1500 обезличенных МРТ снимков детей которые предразметили в BIBSNet Baby Intensity Based Segmentation Network сегментационная сеть основанная на фреймворке nnU Net и распараллели процесс в Docker контейнерах на 20 ВМ что позволило быстро получить основу которую доработали врачи Протестировали несколько архитектур U Net U Net DeepLabV3 и бэкбонов ResNet ResNeXt Лучшим экспериментом стало обучение U Net с ResNeXt50 в качестве сети для извлечения признаков с помощью функции потерь DiceLoss Метрикой качества выступала IoU Скорость обученной нейронной сети запущенной на CPU составляет порядка 3 секунд и не нуждается в дорогих GPU на стороне клиники В будущем код разработки планируют выложить в открытый доступ чтобы её могли использовать в других медицинских проектах Подробности о том как разрабатывали нейросеть на Хабре
Machinelearning
28.08.2025 08:55
Grok Code Fast 1 быстрая модель кодинга для разработчиков xAI выпустила модель Grok Code Fast 1 ориентированную на разработчиков и быстрое написание кода Модель предлагает контекстное окно в 256 000 токенов при стоимости использования 0 20 за миллион входных токенов и 1 50 за миллион выходных Grok Code Fast 1 до 2 сентября доступна бесплатно в GitHub Copilot Первые пользователи отмечают что модель работает в несколько раз быстрее Claude Code и эффективно справляется с поиском и исправлением ошибок хотя для лучших результатов требует детальных запросов github blog Китай обнародовал стратегию тотального внедрения ИИ в экономику Правительство Китая опубликовало план AI Plus который ставит целью глубокую интеграцию ИИ практически во все сферы экономики Документ призывает к усилению финансовой поддержки строительству сверхбольших вычислительных кластеров и развитию отечественной экосистемы ИИ чипов и ПО К 2027 году Пекин планирует внедрить ИИ более чем в 70 ключевых отраслей от производства и здравоохранения до госуправления и потребительской электроники а к 2030 году этот показатель должен превысить 90 Дорожная карта предусматривает массовое распространение беспилотных автомобилей роботов ПК смартфонов и носимых устройств до 2035 года На фоне этого китайские производители чипов намерены в следующем году утроить национальное производство ИИ ускорителей чему будет способствовать запуск новых фабрик ft com ByteDance представила универсальную модель генерации видео ByteDance анонсировала Waver 1 0 модель для генерации из текста в видео изображения в видео и текста в изображение Система поддерживает разрешение до 1080p и длину роликов от 2 до 10 секунд По заявлениям разработчиков Waver отлично справляется со сложным движением и превосходит аналоги на бенчмарках Waver Bench 1 0 и Hermes В основе Waver 1 0 гибридная архитектура DiT и двух текстовых энкодеров flan t5 xxl и Qwen2 5 32B Для генерации в 1080p используется отдельный компонент Waver Refiner который повышает разрешение с помощью диффузионного процесса Для улучшения реализма на этапе инференса применяется технология APG подавляющая артефакты Планы по публикации весов модели не заявлены но попробовать Waver можно в Discord сообществе waver video OpenAI и Anthropic провели перекрестное исследование безопасности своих моделей В рамках беспрецедентного сотрудничества OpenAI и Anthropic протестировали друг у друга модели чтобы создать эталон для независимой оценки ИИ Исследователи получили временный взаимный доступ к API интерфейсам конкурирующих систем Результаты выявили взаимные профили рисков Модели Claude Opus 4 и Sonnet 4 отказывались отвечать на вопросы в которых были не уверены в 70 случаев В то же время модели OpenAI o3 и o4 mini пытались дать ответ гораздо чаще но при этом генерировали больше галлюцинаций Руководители обеих компаний согласились что оптимальным был бы подход сочетающий более частые отказы при неопределенности с меньшим количеством ложной информации Компании надеются повторить подобное перекрестное тестирование в будущем и призывают другие лаборатории присоединиться bloomberg com PromptLock вирус шифровальщик использующий локальную модель Исследователи из ESET выявили новый тип программы вымогателя под названием PromptLock который использует локально развернутую модель gpt oss 20b от OpenAI для генерации уникальных вредоносных скриптов при каждом запуске Поскольку модель работает на зараженной машине через Ollama API вирус не делает сетевых запросов для получения инструкций что позволяет ему обходить традиционные системы обнаружения вторжений Анализ показал что PromptLock способен похищать данные и шифровать файлы а в будущих версиях вероятно сможет и полностью уничтожать информацию Уже замечены версии для Windows и Linux и по мнению экспертов адаптация под macOS не составит труда thehackernews com ai machinelearning big data news ai ml
Machinelearning
27.08.2025 10:01
Anthropic сделала ИИ агента Claude для браузера Chrome Anthropic запустила в режиме исследовательского превью ИИ агента который интегрируется в Chrome в виде расширения Агент работает на базе Claude и позволяет общаться с чат ботом в боковом окне которое сохраняет контекст всего происходящего в браузере Агент может выполнять некоторые задачи от имени пользователя получив на это разрешение В Anthropic заверяют что предусмотрели меры безопасности Пользователи могут ограничить доступ агента к определенным сайтам а по умолчанию уже заблокированы финансовые сервисы и ресурсы с NSFW контентом Перед выполнением рискованных действий таких как публикация данных или совершение покупок агент будет запрашивать разрешение Доступ к Claude for Chrome открыт для 1000 подписчиков тарифа Max Для остальных желающих открыт лист ожидания ai machinelearning big data news ai ml
Machinelearning
26.08.2025 13:04
Российские учёные предложили новый способ борьбы с галлюцинациями ИИ Одна из главных проблем больших языковых моделей они могут генерировать правдоподобные но ложные ответы Исследователи из Сбера разработали метамодели которые повышают точность обнаружения ложных ответов обучаемыми локальными моделями почти на 30 при использовании малого количества данных для обучения На тестах подход сработал лучше чем многие закрытые коммерческие решения уже при обучении на 250 примерах удалось добиться результатов сопоставимых с применением крупнейших LLM в качестве оценщиков Выгода очевидна компании могут сильно сэкономить ресурсы на разметку данных ученые получают новый инструмент для анализа больших языковых моделей а пользователи более точные ответы от AI моделей
Machinelearning
26.08.2025 10:40
Google готовится к запуску модели Nano Banana По слухам которые появились из за поста инженера DeepMind Патрика Лоебера в сети Х на этой неделе мы увидим инпейнт модель для редактирования изображений под названием Nano Banana Модель наделала шуму на Lmarena да и тестеры предварительных версий отмечают способность вносить очень точечные изменения в изображение не затрагивая другие его элементы При этом качество изображений генерируемое Nano Banana сопоставимо с результатами более крупных и ресурсоемких систем Официально Google пока не объявляла дату запуска и не раскрывала информацию о ценах ai machinelearning big data news ai ml
Machinelearning
26.08.2025 07:30
Microsoft выпустила открытую TTS VibeVoice VibeVoice опенсорсная система синтеза речи на английском и китайском языках для создания выразительного аудиоконтента длиной до 90 минут с участием до 4 различных спикеров В системе используются непрерывные токенизаторы речи на сверхнизкой частоте 7 5 Гц и комбинация из LLM для понимания контекста и диффузионная модель для генерации высококачественного аудио Код для инференса уже доступен на GitHub а модель на 1 5 млрд параметров и токенизатор на Hugging Face Обещают более крупную 7B и компактную 0 5B версии модели microsoft github io NotebookLM научился создавать видеообзоры на 80 языках включая русский Теперь возможность превращать загруженные документы и заметки в короткие видеопрезентации доступна на 80 языках включая русский Ранее функция работала только на английском Одновременно компания улучшила и Audio Overviews позволив создавать более длинные и детализированные аудиосводки на разных языках Оба обновления уже начали развертываться и по заявлению Google станут доступны всем пользователям по всему миру в течение недели blog google Nvidia анонсировала Jetson AGX Thor Jetson AGX Thor наиболее производительный на сегодняшний день компьютер для периферийных ИИ вычислений и робототехники Платформа обещает производительность в 2070 терафлопс FP4 что примерно в 7 5 раз превосходит предыдущее поколение Jetson Orin В основе системы GPU на архитектуре Blackwell 14 ядерный процессор Arm и 128 ГБ памяти LPDDR5X Это позволяет запускать большие языковые и мультимодальные модели локально обрабатывая данные с нескольких сенсоров с минимальной задержкой Платформа совместима с программными стеками Nvidia Isaac Metropolis и Holoscan Набор для разработчиков уже доступен для заказа по цене 3499 а поставки начнутся в следующем месяце Серийные модули Jetson T5000 для готовых роботов появятся в конце 2025 года по цене 2999 за штуку при заказе от 1000 единиц cnbc com Илон Маск подал иск на 1 млрд против Apple и OpenAI xAI и X подали в федеральный суд США антимонопольный иск на сумму 1 млрд долларов против Apple и OpenAI В иске утверждается что компании вступили в незаконный сговор с целью захвата рынков смартфонов и генеративного ИИ нарушая антимонопольное законодательство США Согласно 61 страничному документу эксклюзивная интеграция ChatGPT в iOS и манипуляции с ранжированием в App Store целенаправленно занижают позиции конкурирующих чат ботов Это по мнению Маска делает невозможным для любой другой ИИ компании кроме OpenAI достичь первого места в магазине приложений В Apple отказались от комментариев В OpenAI назвали иск продолжением систематических нападок со стороны господина Маска wsj com Brave обнаружили уязвимость в Comet от Perplexity Проблема по словам Brave заключается в так называемых непрямых инъекциях промптов Злоумышленники могут встраивать вредоносные команды в веб страницы которые ИИ ассистент Comet при анализе контента воспринимает как инструкции от пользователя В ходе тестов Brave продемонстрировала как можно заставить Comet прочитать и отправить атакующим конфиденциальные данные email адреса и одноразовые пароли Perplexity выпустила обновления однако проблема все еще не решена полностью brave com ai machinelearning big data news ai ml
Machinelearning
23.08.2025 08:32
Nvidia остановила производство чипов H20 для Китая Nvidia приостановила выпуск своих ИИ чипов H20 разработанных специально для китайского рынка в обход американских санкций Причиной стало новое распоряжение Пекина которое вынуждает местные компании отказаться от продукции Nvidia из за опасений связанных с безопасностью В результате около 700 000 уже произведенных и готовых к отправке чипов которые ранее получили одобрение от правительства США теперь простаивают на складах партнера по упаковке Вся цепочка поставок оказалась парализованной несмотря на то что Вашингтон и Nvidia уже достигли политического соглашения theinformation com Cohere представила ризонинг модель для бизнеса Cohere выпустила ризонинг модель Command A Reasoning оптимизированную для ресурсоемких задач требующих логических рассуждений работа в агентных системах и анализ больших документов По заявлению разработчиков на бенчмарках BFCL v3 Tau bench и DeepResearch Bench модель превосходит gpt oss 120b и Mistral Magistral Medium Command A Reasoning может работать на одном GPU H100 или A100 с контекстным окном в 128 тыс токенов которое можно расширить до 256 000 токенов на нескольких GPU Модель уже доступна на платформе Cohere а на Hugging Face выложена версия для некоммерческого использования под лицензией CC BY NC 4 0 cohere com ElevenLabs выпустила альфа версию TTS модели v3 ElevenLabs представила обновленную модель для синтеза речи Eleven v3 Она уже доступна в альфа версии через API Модель знает более 70 языков включая русский и получила расширенные возможности для передачи эмоций и дополнительные элементы управления голосом Одной из главных особенностей стал режим диалог который может обрабатывать неограниченное количество спикеров в одном аудио Для управления интонациями и эмоциональными оттенками речи добавлены специальные аудиотеги Доступ к API Eleven v3 alpha можно получить с бесплатного аккаунта однако некоторые функции могут быть платными elevenlabs io Anthropic разработала классификатор для блокировки запросов связанных оружием массового поражения Anthropic создала ИИ классификатор который выявляет опасные запросы касающиеся технологий связанных с биологическим химическим и ядерным оружием Предварительные тесты показали точность системы на уровне 96 Цель классификатора фильтровать информацию об оружии массового поражения еще на этапе предварительного обучения моделей Такой подход должен предотвратить ситуации когда чат боты могут предоставить инструкции по созданию оружия не влияя при этом на их способность выполнять безопасные задачи В Anthropic в очередной раз напомнили что безопасность должна быть фундаментальным принципом при разработке ИИ anthropic com Илон Маск анонсировал создание компании симулятора Microsoft Илон Маск объявил о запуске новой софтверной компании Macrohard созданной в рамках его инициативы xAI Главная цель проекта построить полностью управляемую ИИ программную корпорацию которая будет симулировать деятельность Microsoft и конкурировать с ней По замыслу Маска сотни специализированных ИИ агентов будут совместно работать над созданием программных продуктов полностью воспроизводя цифровые операции гиганта Название Macrohard является явной ироничной отсылкой к Microsoft подчеркивая амбиции проекта стать его прямым конкурентом в сфере ПО Elon Musk в сети X ai machinelearning big data news ai ml
Machinelearning
22.08.2025 10:40
Boston Dynamics показали впечатляющее видео своего робота Atlas получает изображение с камеры данные о положении тела и текстовую команду На основе этого модель генерирует плавные движения всего корпуса 30 раз в секунду Это не набор хрупких скриптов а система которая сама думает как выйти из ситуации Вместо того чтобы прыгать от точки к точке система сразу строит короткую последовательность действий примерно на полторы секунды вперёд Часть из них выполняется а потом план обновляется чтобы движения оставались точными и естественными Робот показывает что может работать в реальном бардаке где всё падает двигается и мешает работе ai machinelearning big data ai robots BostonDynamics atlas