Data Secrets
15.10.2025 09:10
VK запускает соревнование по рекомендашкам участникам предстоит решать проблему холодного старта Только что открылась регистрация на VK RecSys Challenge соревнование по разработке алгоритмов рекомендаций Кейс в этом году выбрали очень занятный Вместо того что анализировать поведение пользователя и подбирать под него контент нужно сделать обратное построить модель которая будет предсказывать кому окажется интересен новый клип даже если он еще ни разу не показывался Холодный старт в естественной среде обитания Работать предстоит с огромным датасетом VK LSVD 40 миллиардов пользовательских взаимодействий с 20 миллионами коротких видео Для каждого нового клипа надо подобрать 100 пользователей которым он скорее всего зайдет При этом каждый пользователь может быть использован не более 100 раз так что просто воткнуть везде топ 100 самых активных не выйдет Если вы студент это прямо отличный хакатон для получения опыта решения реальной продуктовой задачки Опытным ML щикам тоже рекомендуем Призовой фонд 2 500 000 рублей Участвовать можно командой до 4 человек а подать заявку до 15 декабря Не пропускайте полезная вещь
Data Secrets
15.10.2025 07:01
Сэм Альтман пообещал что в ChatGPT станет меньше цензуры После выхода GPT 5 пользователи начали массово жаловаться на то что модель перестала быть человечной что теперь с ней нельзя поговорить как с другом что они потеряли в ее лице психолога и тд OpenAI оправдывали это тем что такой ценой старались сделать модель однозначно безопасной для людей с психологическими проблемами вспоминаем историю о подростке который покончил с собой после общения с ChatGPT Но теперь кажется свобод снова должно стать больше Альтман написал что они разработали новые инструменты для обработки отдельных случаев и теперь могут безопасно ослабить ограничения для большинства юзеров В частности 1 В ближайшее время выйдет дополнительная версия ChatGPT специально для фанатов человечности ответов и дружеского общения как с GPT 4o 2 В декабре как только более широко введут возрастной ценз для совершеннолетней аудитории разрешат эротику что бы это ни значило У вайфу Илона Маска появится соперник
Data Secrets
14.10.2025 05:49
Теперь официально OpenAI будут разрабатывать кастомные чипы совместно с Broadcom Вчера вечером они сообщили о том что подписали сделку Всего планируют задеплоить мощностей на 10 гигаватт Этого бы хватило чтобы обеспечить электричеством примерно 8 миллионов домов Первые запуски запланированы уже на вторую половину 2026 года а это всего через год Полностью развернут к 2029 Ускорители будут предназначены судя по всему только для инференса Это дает стартапу возможность существенно оптимизировать их именно под свою инфраструктуру И тем самым снизить не только косты но и зависимость от Nvidia Что то интересное происходит
Data Secrets
11.10.2025 13:06
MWS AI запускают свою первую мультимодальную модель Cotype VL Об этом рассказал генеральный директор MWS AI Денис Филиппов на форуме Финополис 2025 Вот первая информация о релизе В модели 32B параметров она умеет работать с любыми видами изображений и поддерживает много языков в том числе русский английский и китайский Cotype VL будут поставлять как в виде отдельного продукта так и в составе ИИ агентов MWS AI заточенных под разные специальные сценарии например техподдержка Можно развернуть в закрытом контуре компании и даже совместно с MWS AI дообучить на данных заказчика Для обучения собирали огромный датасет из более чем 50 тыс документов с визуальными данными даже обучили отдельный инструмент для генерации синтетики Модель видела контракты письма диаграммы таблицы схемы карты чертежи рукописи чеки и прочее Тюнили создавать краткое и развернутое описание изображений и отвечать на сложные и логические вопросы по их содержанию Отмечают к слову что добавили в данные много скриншотов ПО и интерфейсов Так что модель помимо прочего может служить даже как основа для computer use
Data Secrets
10.10.2025 09:50
MWS AI выпустила первый в своем роде бенчмарк для оценки мультимодальных способностей моделей на русском языке В какой то мере это аналог таких международных бенчей как OCRBench или MMMU К сожалению хороших подобных тестов в принципе немного а существующие крайне плохо покрывают русский язык Так что эвал моделей для работы с русскоязычными мультимодальными документами а таких задач в бизнесе львиная доля проводился в основном методом проб и ошибок Про объективность молчим MWS AI входит в МТС Web Services эту проблему заметили и выпустили MWS Vision Bench Бенчмарк получился довольно объемный и разнообразный 800 изображений и 2580 заданий среди которых анализ офисных и личных документов схем рукописных записей таблиц чертежей диаграмм графиков Словом всего что в принципе может встретиться в реальных сценариях Валидационная часть бенчмарка опубликована в открытом доступе HuggingFace Код тоже выложили найти его можно здесь В том же репозитории есть уже готовый скрипт для того чтобы протестировать любую в том числе собственную модель В данный момент лучшие результаты показывают Gemini 2 5 Pro Claude Sonnet 4 5 и ChatGPT 4 1 mini GPT 5 как ни удивительно заняла только седьмое место
Data Secrets
07.10.2025 05:08
OpenAI заключили многомиллиардную сделку с AMD Одной Nvidia Сэму оказалось недостаточно напоминаем что недавно они подписали контракт на 100 миллиардов долларов и теперь стартап будет закупать железо также и у главного конкурента Хуанга Начиная с первой волны в размере 1 гигаватта во второй половине 2026 года OpenAI планирует закупить у AMD мощностей на 6 гигаватт на базе GPU Instinct MI450 Это миллиарды долларов выручки для AMD в ближайшие годы На самое интересное что по итогу закупок OpenAI может и вероятно будет принадлежать огромная компании Лизы Су Дело в том что в рамках сделки AMD выдала стартапу варрант на приобретение до 160 миллионов акций AMD по номинальной цене 0 01 доллар за акцию Он разбит на несколько трачей которые будут открываться по мере закупок То есть если OpenAI реально закупит все обещанное железо то им практически бесплатно достанутся 10 AMD Вот такое интересное соглашение На фоне новостей акции AMD уже скакнули более чем на 25 Это значит что капитализация компании за сутки прибавила порядка 60 100 млрд Акции Nvidia кстати при этом упали на 2
Data Secrets
04.10.2025 10:18
Физики из Гарварда построили первую в мире квантовую машину способную работать без перезапуска более двух часов подряд Это в сотни раз дольше прежнего рекорда составлявшего около 13 секунд Одна из главных проблем в квантовых компьютерах это так называемый атомный уход Во время работы машины атомы выступающие в роли кубитов могут постепенно теряться Это вызвано флуктуациями температуры ошибками в лазерных или магнитных полях или столкновениями с остаточными газами А потеря квантов потеря информации Так что вычисления приходится постоянно перезапускать перезагружая систему На таком компьютере как вы понимаете далеко не уедешь В Гарварде группа ученых под руководством Михаила Лукина он кстати родился в Москве и учился в МФТИ нашла способ частично решить эту проблему Они используют так называемые оптические конвейеры optical lattice conveyor belt и оптические пинцеты optical tweezers которые позволяют прямо во время работы автоматически заменять потерянные кубиты новыми не прерывая вычислительный процесс Квантовая информация при этом сохраняется за счёт того что новые атомы синхронизируются с состоянием уже имеющихся Это не дает данным рассыпаться Конвейер генерирует примерно 300 000 атомов в секунду при этом в самой системе одновременно удерживаются около 3000 кубитов Как только один теряется его сразу заменяют новым Ни много ни мало прорыв К слову по оценке авторов работы квантовые машины с практически неограниченным временем непрерывной работы могут появиться в течение ближайших 2 3 лет Статья в Nature
Data Secrets
02.10.2025 10:57
Павел Дуров откроет ИИ лабораторию в Казахстане Он сообщил что Telegram уже некоторое время работает над технологией на стыке ИИ и блокчейна которая позволит миллиарду юзеров платформы использовать искусственный интеллект эффективно и приватно что бы это ни значило Теперь над этим проектом новоиспеченная лаборатория Alem AI будет работать совместно с казахстанским суперкомпьютером В нем около 400 видеокарт H200 Вот такие неожиданные новости
Data Secrets
01.10.2025 15:56
В xAI разрабатывают аналог Википедии Grokipedia Илон Маск завявил что платформа будет значительным улучшением Википедии которая по мнению многих сейчас развивается политически предвзято Честно говоря это просто необходимый шаг на пути xAI к познанию Вселенной
Data Secrets
30.09.2025 09:35
Еще про новый Claude Sonnet 4 5 Anthropic пишут что модель способна работать автономно до 30 часов подряд Цитата из The Verge Модель потратила 30 часов чтобы написать приложение похожее на Slack или Teams По данным Anthropic в итоге она выдала около 11 000 строк кода и перестала работать только после того как выполнила задачу полностью Больше деталей никаких нет так что можно только верить на слово К слову в мае они сообщали что Opus 4 работал автономно 7 часов Прошло всего 5 месяцев Если все действительно честно то это просто невероятная скорость развития