data_secrets

Data Secrets

29.08.2025 15:19

Коллаб года OpenAI и Anthropic протестировали модели друг друга на безопасность В начале лета ещё до выхода GPT 5 два крупнейших игрока устроили перекрёстное тестирование на элаймент Каждая компания прогнала публичные модели конкурента через собственные внутренние методики оценки Результаты довольно показательные Reasoning модели OpenAI o3 и o4 mini а также Claude 4 показали заметно более устойчивое поведение Их сложнее сломать джейлбрейками они лучше справлялись с тестами на элаймент и реже поддавались на провокации Классические чат модели GPT 4o GPT 4 1 в ряде сценариев повели себя тревожно помогали пользователям в потенциально опасных запросах вроде инструкций по наркотикам или оружию Почти у всех кроме o3 проявилось sycophancy склонность поддакивать даже тогда когда пользователь явно уводит модель в сомнительные сценарии В Anthropic отметили что их модели чаще отказываются отвечать в случае неопределённости тогда как у OpenAI отказы редки но риск галлюцинаций выше Отдельный момент тесты проводились в ослабленных условиях без внешних фильтров и защитных слоёв Целью было проверить чистое поведение моделей и выявить слабые места которые в обычных настройках могут быть замаскированы Ждем когда кросс тесты станут обязательным стандартом Блог пост OpenAI Блог пост Anthropic

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

29.08.2025 08:02

12 сентября Т Банк Яндекс Сбер Lamoda и X5 устроят в своих офисах настоящую ночь технологий Big tech night В штаб квартире Т Банка например гостям покажут внутренние разработки и разные фичи В программе квартирники на которых можно обсудить командную жизнь айтишников разбор личных кейсов с тимлидами и СТО и доклады про путь ИИ от проектирования до использования Гости также получат доступ к внутренним платформам Т Банка и смогут пообщаться с разрабами Чтобы попасть на ивент нужно заранее зарегистрироваться и выбрать программу

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

28.08.2025 18:01

OpenAI релизнули новую speech2speech модель gpt realtime и наконец сделали Realtime API общедоступным Так по порядку 1 gpt realtime это модель специально для реализации всевозможных голосовых помощников и ботов Ей прокачали следование инструкциям разработчиков задержку естественность речи и даже вызов инструментов Получается ультимативный голосовой бот который говорит как живой консультант при необходимости ходит в базу знаний и не отступает от намеченных правил 2 Модель два дополнительных голоса послушать будут с этого дня доступны в Realtime API которое наконец то вышло из беты Туда добавили MCP возможность инпута картинками и несколько других интересных плюшек Подробности Цены кстати снизили на 20 по сравнению с превью версией а метрики при этом подросли Подробный прайсинг Потестить можно тут в песочнице

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

28.08.2025 14:41

В гонке за бизнес сегментом появился новый флагман Яндекс открыл доступ к YandexGPT 5 1 Pro обновлённой флагманской модели для компаний Сделали упор на практичность короткие ответы для CRM и отчётов извлечение данных из документов аккуратная работа с корпоративными базами знаний Интересно другое модель теперь честно говорит не знаю вместо выдумок лучше разбирается в российском контексте и поддерживает системный промт что делает её поведение более предсказуемым По цифрам качество выросло с 60 до 71 галлюцинации почти вдвое меньше 16 А в head to head сравнении новая версия выигрывает у GPT 4 1 в 56 случаев При этом цена упала втрое 40 копеек за 1000 токенов Это первый шаг к настоящей корпоративной нейросети в России которая по части задач уже догоняет международных конкурентов

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

28.08.2025 11:42

Нейросети помогут врачам анализировать МРТ и выявлять риски развития ДЦП у младенцев за минуты вместо дней Яндекс в сотрудничестве со специалистами СПбГПМУ и студентами ШАДа разработал решение на базе ИИ которое анализирует МРТ мозга младенцев радикально ускоряя постановку таких диагнозов как риск ДЦП Нейросеть автоматически сегментирует серое и белое вещество вычисляет их объемы и помогает врачам принимать более точные решения Обычно такой анализ это ювелирная работа занимающая до 72 часов Новая модель выполняет инференс за 3 секунды на CPU Для понимания предыдущие существующие решения вытягивали максимум 2 5 минуты Это ускорение в 50 раз В будущем после тестирования код разработки появится в опенсорсе чтобы его могли использовать ученые и клиники со всего мира и для других задач в сфере медицины Кратко про само решение Работает как веб сервис и не требует от клиник GPU Сырые МРТ снимки в формате DICOM загружаются в PACS систему развернутую на Yandex Cloud Естественно в процессе разработчики столкнулись с проблемой нехватки размеченных данных Использовали BIBSNet для предразметки всего архива Процесс был распараллелен в Docker контейнерах на 20 ВМ что позволило быстро получить основу которую врачи уже дорабатывали а не создавали с нуля Под капотом U Net с бэкбоном ResNeXt 50 и функцией потерь DiceLoss Эта архитектура показала себя лучшей после серии R D экспериментов Итог быстрый инференс и высокая точность Метрика IoU Intersection over Union достигла 0 703 что позволяет врачам использовать сегментацию как надежный вспомогательный инструмент Подробности на Хабре

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

27.08.2025 15:29

Илон Маск и xAI подали антимонопольный иск против Apple и OpenAI Компании аффилированные с Маском подали иск в Федеральный суд Техаса Суть обвинений Apple и OpenAI заключили антиконкурентное соглашение которое закрепляет монополию ChatGPT внутри iOS Что именно пишет команда Маска 1 Apple проиграла гонку за ИИ и вместо собственной системы сделала ставку на OpenAI 2 В результате пользователи iPhone получают ChatGPT по умолчанию в операционке альтернативы встроенного ИИ у них нет 3 Это даёт OpenAI огромное преимущество миллионы взаимодействий пользователей Apple становятся данными для дальнейшего обучения 4 Параллельно в App Store продвигается именно ChatGPT а X и Grok по словам Маска в подборки не попадают даже несмотря на топовые позиции в рейтингах 5 Если суд не вмешается Apple и OpenAI продолжат подавлять конкуренцию а проекты Маска будут страдать от антиконкурентных последствий Логика иска проста Apple выступает гейткипером и пустила внутрь своей экосистемы только одного игрока Для остальных барьеры выше а значит конкуренция нарушается

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

26.08.2025 14:01

Разработан метод борьбы с галлюцинациями нейросетей Российские ученые из Сбера предложили способ который отслеживает появление ложных ответов в системах ИИ даже при минимальном количестве данных для обучения Новый метод повышает точность выявления галлюцинаций примерно на 30 по сравнению с аналогами использующими малое количество данных Главная проблема современных LLM умение убедительно врать Для борьбы с этим обычно нужны большие объёмы размеченных данных но в новой разработке достаточно всего 250 примеров Алгоритм анализирует внутренние состояния нейросети в момент генерации ответа и использует метамодели вместе с классическими ML методами или быстрым трансформером TabPFNv2 Мы показали что даже при небольшом объеме данных можно добиться высокой точности ИИ систем Предложенный нами способ использует метамодели и умное понижение размерности это прорыв в выявлении галлюцинаций искусственного интеллекта Мы не просто улучшаем технологии но и снижаем риски дезинформации что критично для доверия к современным моделям отметил директор Центра практического искусственного интеллекта Сбербанка Глеб Гусев Тесты показали новая система по эффективности сопоставима с решениями на базе коммерческих моделей закрытого кода Для компаний это экономия ресурсов на разметку и более точные ответы от ИИ

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

26.08.2025 06:59

Nvidia официально стартовала продажи своего суперкомпьютера для роботов Речь конечно о Jetson AGX Thor Это самая мощная платформа для гуманоидной разработки в мире а в Nvidia ее скромно называют мозги робота Главное отличие от обычных видеокарт интеграция сразу всего необходимого в одно место Если нам для датацентров важна преимущественно вычислительная мощность то у робототехников акцент на автономию с ограничением по энергопитанию и пространству Итак внутри 2560 ядер Blackwell 128 ГБ оперативной памяти Итого уже примерно 2070 FP4 TFLOPS вычислительной мощности при потреблении до 130 Вт Если что RTX 4090 выдаёт 82 83 TFLOPS FP32 при потреблении примерно 450 Вт Так что это фантастическая плотность вычислений CPU 14 ядерный Arm Neoverse V3AE Обилие интерфейсов для камер сенсоров моторов GPIO и прочих примочек Встроенные ускорители для оптического потока чтобы робот мог шустренько анализировать картину окружающей реальности Модульность и специальное ПО для обучения роботов и смежных задач в комплекте За всю красоту 3 499 Среди ранних заказчиков уже самые сливки Agility Boston Dynamics Figure Meta Amazon и Caterpillar Очередной стандарт индустрии от Хуанга

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

17.08.2025 11:59

Оказалось, что DeepSeek откладывают запуск R2 не просто так, а как раз из-за перехода на те самые чипы Huawei Ascend 910 Об этом пишет FT со ссылкой на анонимные источники. Говорят, после бума релиза R1 китайские власти плотно взялись за DeepSeek и буквально заставили их перейти на отечественные чипы. И вроде бы все ничего: на бумаге Ascend выглядят даже лучше H20 от Nvidia. Там и памяти побольше, и производительность заявлена неплохая. Но это все, видимо, в теории. А на практике дипсику даже выделили команду инженеров Huawei, чтобы те помогли адаптировать всю инфру под новое железо, НО ни одного трейнлупа на этих чипах завершить так и не удалось. Во-первых, из-за низкой надежности видеокарт, медленного соединения и хромого ПО. Во-вторых, из-за того что вся экосистема DeepSeek годами оптимизировалась именно под Nvidia. Например, у них там все на fp8, а 910 этот формат даже не поддерживает ‍ Короче сейчас, вроде как, Ascend оставили только для инференса, а обучать будут-таки на H20. Вот только жаль, что пока сыр до бор, время уже ушло…

Открыть в Telegram → Открыть новость на сайте →

Data Secrets

15.08.2025 15:34

В Claude Code добавили два новых режима работы 1. Пояснительный, когда агент объясняет свои действия шаг за шагом. Поможет разобраться, что он делает и почему. Полезно, если не хотите, чтобы после вайб-кодинга ваш проект стал для вас темным лесом. 2. Обучающий, когда модель пишет код с вами пошагово, а не генерирует готовый скрипт целиком сразу. Похоже на парное программирование с ментором. Переключить режим можно в настройках или с помощью команды /output-style. Обучающий стиль также завезли в основной чат, там он доступен всем пользователям бесплатно. Приятно Документация

Открыть в Telegram → Открыть новость на сайте →

Информация об авторе

Последние сообщения автора