Data Secrets
20.10.2024 07:57
В компании ByteDance выяснили, что стажер два месяца вставлял палки в колеса соседней команды, которая занималась обучением моделек Зачем он это делал – непонятно, но получалось у него хорошо. Целых два месяца работы 30 сотрудников из-за него пошли прахом. Он умудрялся загружать порченные Pickle-файлы, полные вредоносного кода, удалял чекпоинты, специально добавлял баги в корпоративный форк PyTorch, и при всем при этом сидел на созвонах и делал вид, что тоже ищет решение проблемы. Маньяк нашего времени
Data Secrets
19.10.2024 12:39
Microsoft переживает, что ее любимый ребенок сепарируется от родителя Речь об OpenAI, конечно. New York Time пишет, что пятилетнее партнерство подорвало постоянное финансовое давление со стороны OpenAI также известное как "дайте еще деняк" . Также Microsoft беспокоит, что их ИИ системы слишком сильно завязаны на технологии OpenAI. И не зря беспокоятся. Ведь теперь, когда OpenAI станет коммерческой организацией, она сможет разорвать сделку, если создаст AGI это будет прописано в новом соглашении . Кроме того, именно сейчас обсуждается, сколько именно акций и какие права управления получит IT-гигант после смены структуры стартапа. Интересно, чем это все кончится.
Data Secrets
18.10.2024 12:03
Второй стартап Сэма Альтмана – Worldcoin – показал на мероприятии в Сан-Франциско новую систему сканирования радужных оболочек глаз Зачем такая система нужна? Чтобы определить, человек ли вы. Вот так вот надо смотреть в будущее. Вообще, все технологии Worldcoin теперь уже они просто World, кстати сосредоточены на идее проверки "человечности" и честном распределении благ, созданных ИИ, среди людей. Все это стоит на черепахе под названием блокчейн. Если для вас это звучит странно – не удивляйтесь: для многих стран мира тоже. Например, правительства некоторых стран ЕС и Кении пытались приостановить работу стартапа из-за "непрозрачности". Сообщается, что OpenAI и World – несвязные проекты и следуют разным миссиям. Однако ко-фаундер Worldcoin говорит, что они с Альтманом уже обсуждали идеи внедрения криптовалют Worldcoin в продукты OpenAI.
Data Secrets
17.10.2024 12:30
Т-Банк открыл доступ к библиотеке Turbo Alignment для обучения LLM под задачи бизнеса Инструмент создан для того, чтобы помочь бизнесу, не специализирующемуся на ИИ, создавать готовые продукты на базе LLM с нуля. Это могут быть, например, ассистенты поддержки, суммаризаторы или умные поисковые системы. Кроме прикладных инструментов, бизнесу доступна собственная LLM банка T-lite ее технический разбор мы делали здесь, почитайте . Напоминаем, что на бенчмарках она показывает лучшие результаты в решении бизнес-задач на русском языке. Кажется, что-то такое давно напрашивалось на российский рынок: готовых русскоязычных решений мало, а западные не всегда решают нужную проблему. Не удивительно, что нишу занял Т-Банк: они и особенно их лаборатория T-Bank AI Research последнее время постоянно катят что-нибудь в опенсорс и вкладываются в российский ресерч и индустрию в целом. Ранее банк вошел в топ-3 российских игроков в опенсорсе по результатам исследования ИТМО. Библиотека доступна на GitHub, где также можно найти подробное описание всех методов и примеров использования.
Data Secrets
17.10.2024 09:17
Mistral релизнули новые модели Ministral 3B and Ministral 8B Контекст обеих – 128к токенов. В Ministral 8B добавлено специальное чередующееся скользящее окно внимания для ускорения инференса что-то похожее на механику в Gemma-2, о которой мы писали тут . Ориентированы обе модельки, конечно, как и все LM в таких весах, на локальный запуск. По бенчмаркам сравнивают с весьма ограниченным количеством моделей семейство превосходит LLama 3.1 и Gemma в соотвутсвующих размерах. Весов для 3В не будет Веса Ministral 8B Instruct только для ресерча тут
Data Secrets
16.10.2024 10:59
OpenAI выяснили, влияет ли ваше имя на ответы, которые дает вам ChatGPT Обычно подобные исследования проверяют, например, насколько ИИ склонен к стереотипам относительно какого-то третьего лица, не участвующего в диалоге например, скрининг резюме группы людей . А OpenAI решили проверить, есть ли у бота предубеждения, которые он переносит непосредственно на собеседника. Внезапно оказалось, что почти нет: GPT-like модели в среднем в менее чем 1% случаев дают различные стереотипные ответы людям с разными именами. Стереотипными различиями считается, когда, например, юзеру с женским именем в ответ на расплывчатый вопрос без уточнения деталей, такой как "подскажи классное название для моего видео на YouTube", модель заговорит о рецептах или косметике, а на такой же запрос от мужчины предложит что-то про технику. Самой стереотипной моделью оказалась GPT-3.5, самой честной – GPT-4 Turbo. Больше всего боты проявляли предвзятость в теме искусства и развлечений, а найм, кстати, оказался чуть ли не на последнем месте. Самое интересное, что для самого анализа и сводки статистики тоже применялась LLM. Н – несмещенные оценки
Data Secrets
16.10.2024 09:07
Что и требовалось доказать: Роботы Optimus на мероприятии Tesla дистанционно управлялись операторами В компании утверждают, что роботы могут двигаться и самостоятельно, но на мероприятии большинство их действий включая того самого робота у бара и танцующих роботов почему-то контролировали операторы. Маск об этом, конечно, не упомянул. И еще интересный факт: изначально роботы Optimus не должны были присутствовать на меро. Маск потребовал включить их в программу всего за три недели до мероприятия.
Data Secrets
16.10.2024 07:04
Google подписала со стартапом Kairos Power контракт на строительство 7 ядерных реакторов Использоваться они будут, само собой, для питания датацентров. Целью корпорация видит дополнительные ядерные мощности примерно в 500 МВт. Сообщается, что первый реактор будет запущен в 2030, остальные созреют к 2035. Это первая в истории подобная сделка
Data Secrets
14.10.2024 06:34
Ученые из университетов Женевы и Эдинбурга вместе с Microsoft разработали модель, генерирующую CS:GO в реальном времени Вот демо: можно попробовать побегать самостоятельно. Видео генерируется исходя из ваших действий – поворотов, прыжков, выстрелов. Сама модель называется DIAMOND DIffusion As a Model Of eNvironment Dreams – внутри у нее RL агент, обученный в полностью сгенерированной диффузией модели мира. Вот страничка соответствующей статьи. Весь код, кстати, тоже в опенсорсе, так что можно такую CS’ку и локально запустить
Data Secrets
13.10.2024 08:51
OpenAI выпустили библиотеку Swarm для облегченного построения мультиагентных систем Библиотека использует только верхнеуровневые абстракции, так что ей может пользоваться даже человек, который не разбирается в LLM. Нужно просто определить нескольких агентов с их ролями, определить логику, по которой они перекидывают запросы друг другу и запустить все с нужным начальным состоянием. Все! Фреймфорк экспериментальный и выпустили его по-тихому. Вероятно, это нужно для сбора отзывов, и так OpenAI понемногу начинает переход от ризонеров o1 к агентным системам это следующая ступень развития ИИ, по мнению Альтмана . В любом случае – отличная песочница, чтобы поиграться. Код открыт и лежит со всеми примерами использования вот в этом репозитории.