Data Secrets
26.09.2025 09:24
Новый датасет T ECD для екома Т выкатили не просто датасет а крупнейший кросс доменный набор для развития рексистем Основной T ECD более 135 млрд взаимодействий данные на основе 44 млн пользователей 30 млн товаров и 1 2 млн брендов Сборка данных глубиной от 1 до 3 5 лет доступны краткосрочные и долгосрочные пользовательские истории Домены Marketplace Retail Payments Offers и Reviews Рекомендательные задачи подходит для next item next basket session based топ N и других Версии полный датасет и T ECD Small на 5 млрд событий а также облегчённый набор на 1 млрд взаимодействий для быстрых экспериментов Почти все доступные датасеты для исследований моно доменные и маленькие а Т ECD первый по настоящему кросс доменный датасет такого масштаба Он универсален можно использовать как целиком так и по доменам а еще подходит для разных подходов от базовой коллаборативной фильтрации до графовых рекомендаций Всё это уже доступно на Hugging Face под Apache 2 0
Data Secrets
23.09.2025 14:10
Большая коалиция из 10 Нобелевских лауреатов 70 компаний и бывших глав государств подписала требование о введении глобальных красных линий для ИИ Об этом стало известно сегодня на заседании Генеральной Ассамблеи ООН Всего требование подписало 200 человек бизнесмены политики ученые Среди них Джеффри Хинтон Йошуа Бенджио и Войцех Заремба соучредитель OpenAI Кратко о содержании Подписанты требуют ввести международные юридически обязывающие красные линии для развития и применения ИИ Это нужно чтобы исключить глобальные риски для человечества массовую безработицу искусственные пандемии нарушение прав человека и тд Конкретный список таких красных линий не приведен но предлагают например запрет на использование ИИ для производства оружия организации массовых атак несанкционированное реплицирование ИИ систем в том числе без участия человека и все такое Государства должны в кавычках договориться о таких правилах до конца 2026 года а также нужно создать независимый международный орган для мониторинга соблюдения законов и оперативной оценки угроз Вот такой вот внушительный прецедент На данный момент это самая крупная подобная петиция Посмотрим что выйдет red lines ai
Data Secrets
22.09.2025 17:24
OpenAI заключили масштабное партнерство с Nvidia Главное Nvidia инвестирует в стартап 100 миллиардов долларов Еще раз 100 миллиардов долларов Но не просто так конечно а железом Вместе они планируют построить датацентров как минимум на 10 гигаватт соответсвенно расчет 10 миллиардов на ГВт Это миллионы GPU В общем Nvidia теперь полноценный стратегический поставщик вычислений для Альтмана Первый кластер на платформе NVIDIA Vera Rubin планируется запустить во второй половине 2026 года Буквально историческая сделка openai com index openai nvidia systems partnership
Data Secrets
18.09.2025 12:22
Nature выложили статью про R1 от DeepSeek Вроде как можно поздравить команду Но есть одно но сама статья вышла всего 9 месяцев назад Если говорить серьёзно у китайских AI стартапов сейчас непростая ситуация Вчера FT написали что Китай запретил закупать чипы Nvidia после того как правительство решило что отечественные процессоры уже достаточно хороши Напомним что выход R2 у DeepSeek задержался именно из за перехода на чипы Huawei Ascend 910 Получается довольно любопытный контраст на фоне новостей про огромные датацентры от конкурентов
Data Secrets
17.09.2025 06:33
Агенты теперь смогут безопасно платить Google выпустили Agent Payments Protocol АP2 Его можно будет использовать как расширение MCP или A2A Протокол задуман как единый фреймворк который позволит агентам и продавцам проводить любые виды транзакций На практике это будет работать благодаря цифровым мандатам Когда вы говорите агенту Найди мне новые белые кроссовки Nike формируется Intent Mandate то есть ваше предварительное намерение уже фиксируется документально Когда агент предложит вам варианты а вы тыкните Хочу вот эти покупай сформируется Cart Mandate Этот документ фиксирует человек выбрал одобрил знает цену и ответственен за эту покупку В случае отложенных задач типа Купи билеты как только они появятся в продаже Cart Mandate может формироваться автоматически без человека но тогда вы должны четко зафиксировать диапазон одобренных вами цен тайминг и прочие условия То есть по сути протокол фиксирует что агент исполнитель с доверенностью а транзакция происходит на деле между вами и продавцом Юридически это очень нужная штука В проекте уже участвуют более 60 партнеров включая Mastercard PayPal Intuit и Salesforce Интересно взлетит или нет GitHub Блогпост
Data Secrets
16.09.2025 17:38
Figure AI привлек 1 миллиард долларов при оценке в 39 миллиардов Это делает его одним из самых дорогих стартапов с мире и самым дорогим робо стартапом в истории В Figure вложились NVIDIA Intel Capital LG Technology Ventures Salesforce T Mobile Ventures и Qualcomm Ventures гигант на гиганте Возглавила раунд Parkway Venture Capital Деньги пойдут на масштабирование производства гуманоидов железо для обучения и симуляций там как раз Nvidia сделали новые видеокарты для роботов а также на развитие инфры для сбора данных Честно кто кто а Figure AI реально заслужили Только за последний год они Первыми сделали робота с ризонингом и обучили фундаментальную VLA модель Helix которая даже по сей день удивляет своей универсальностью Интегрировали своих роботов на завод BMW на котором те выполняют реальные задачи Первыми умудрились сделать переход sim to real перенос навыков из обучения в симуляции а реальный мир в zero shot без дообучения а это настоящий инженерный прорыв Анонсировали собственный завод по производству роботов Так что от них можно ожидать прорывов Короче большой день для любителей роботов
Data Secrets
16.09.2025 08:01
Вышла GPT 5 Codex Это версия GPT 5 оптимизированная специально для программирования и агентных сценариев Пишут что она способна автономно работать часами Что показалось прикольным Модель подстраивается под coding стиль проекта То есть если видит например функциональное программирование выдавать будет тоже функционалку Можно прикреплять не только текст но и скриншоты архитектурные заметки дизайн схемы Может и до интеграции с Figma когда нибудь доживем В зависимости от задачи модель может работать от нескольких секунд до нескольких часов OpenAI говорят что однажды модель работала над их задачей 7 часов Что то тестировала итерационно исправляла и дописывала По тестам в нижних 10 запросов по количеству токенов модель использует на 93 7 меньше токенов по сравнению с обычной GPT 5 а для самых сложных задач раздумывает и тестирует вдвое дольше Метрики SWE bench Verified 74 5 качество рефакторинга улучшено с 34 до 51 3 Пока чисел мало так что ждем Из остального интеграция с GitHub улучшенный Code review и оценки безопасности облачный hand off то есть поддерживает работу в локальном режиме но затем может перехватываться облаком Уже доступно в VSCode JetBrains и через терминал Попробовать могут любые подписчики тарифов OpenAI так что обязательно тестим openai com index introducing upgrades to codex
Data Secrets
14.09.2025 09:12
Из xAI за одну ночь уволили 500 человек Все они работали разметчиками данных 500 специалистов это если что примерно треть всего подразделения аннотаций данных А подразделение аннотаций в свою очередь является самым большим в xAI Увольнения прошли не слишком гладко и красиво сотрудникам отправили внезапные письма по электронной почте с уведомлением об увольнении и в тот же день отозвали все доступы На xAI уже сыпятся жалобы но в это мы углубляться не будем Интересно другое в тот же день это была пятница xAI со своего аккаунта в X выложили пост такого содержания ИИ тренеры в xAI приносят огромную пользу Мы увеличиваем нашу команду ИИ тренеров в 10 раз Мы нанимаем специалистов в таких областях как STEM финансы медицина безопасность и др Присоединяйтесь к нам и помогите нам создать искусственный интеллект ищущий истину Да мы ничего не перепутали Они уволили 500 ИИ тренеров и тут же объявили что хотят набрать несколько тысяч человек в эту же команду Видимо увольнения не были вопросом низкой эффективности сотрудников скорее это стратегия Судя по всему уволили только аннотаторов общего назначения то есть тех кто не является большим специалистом в какой то области а скорее занимался универсальной более тривиальной разметкой Такую разметку явно хотят автоматизировать а человеческие ресурсы использовать только для нетривиальных задач в сложных областях И в этом есть смысл Интересно эта новость к какой категории относится ИИ забирает нашу работу или ИИ создает новые рабочие места
Data Secrets
12.09.2025 11:03
В Албании впервые в мире ИИ занял пост министра Цифровую систему по имени Diella с албанского переводится как солнце официально назначили министром в сфере финансов Она будет отвечать за госзакупки и проведение тендеров Цель вообще исключить человеческий фактор То есть в Албании таким образом надеятся бороться с коррупцией и повышать прозрачность расходов Ждем пока Diella невзначай закупит из госбюджета миллион GPU
Data Secrets
09.09.2025 10:46
У OpenAI снова проблемы с переходом в коммерческую организацию В Калифорнии где находится компания разгорается конфликт вокруг её реструктуризации Законы штата обязывают власти защищать интересы благотворительных фондов и дают им право подавать в суд если некоммерческая организация действует вразрез со своим уставом Теперь под проверку попала и OpenAI К делу уже подключилось множество игроков крупнейшие фонды профсоюзы Meta и конечно же Илон Маск с xAI они требуют от прокурора вмешаться и не допустить превращения OpenAI в прибыльную компанию Для OpenAI это крайне опасный прецедент Вся её финансовая модель завязана на переходе в for profit Инвесторы пообещали около 19 млрд но только при условии получения акций новой структуры Без этого будущее IPO и дальнейшее финансирование окажутся под угрозой Если сделку заблокируют OpenAI придётся искать обходные пути например перенести штаб квартиру в штат с более мягкими законами www wsj com tech ai openai for profit conversion opposition 07ea7e25