Data Science | Machinelearning [ru]
12.11.2025 15:07
ИИ помощник для востоковедов как Яндекс помогает гуманитарной науке В Институте востоковедения РАН запустили систему на базе Yandex AI Studio которая анализирует научные тексты на восточных языках и формирует аналитические выжимки фактически это ИИ ассистент для исследователей В основе решения генеративные модели Yandex Cloud обученные совместно специалистами платформы и студентами Школы анализа данных Архитектура построена на Yandex AI Studio платформе для разработки и внедрения ИИ агентов Уже обработано более 1 5 млн документов на четырех вариантах китайского языка континентальном тайваньском гонконгском и сингапурском Система умеет выделять ключевые факты создавать краткие аналитические отчёты и даже генерировать русскоязычные дайджесты по публикациям из китайских СМИ В перспективе поддержка японского арабского турецкого и персидского языков В итоге скорость анализа выросла с нескольких часов до 10 15 минут на исследовательскую задачу что открывает новые возможности для гуманитарных исследований Проект наглядный пример того как облачные технологии и LLM из Yandex Cloud применяются в академической среде для решения специализированных задач
Data Science | Machinelearning [ru]
10.11.2025 18:07
Учёные создали ИИ который превращает активность мозга в текст В Японии расшифровали сигналы мозга и восстановили о чем человек думает в виде описаний а не отдельных слов Для этого ИИ обучили на 2000 видео чтобы он мог распознавать связи между сценами в видео сюжетом и тем как на образы реагирует человеческий мозг Чтение мысли всё ближе и ближе xCode Journal
Data Science | Machinelearning [ru]
07.11.2025 18:07
Kimi K2 Thinking Новая open source модель для сложных рассуждений и агентных задач Вышла новая модель Kimi K2 Thinking и если вы увлекаетесь ИИ то это прямо то что стоит отметить Эта модель очередной шаг к масштабированию вычислений и задач связанных с логикой кодом и агентами Способность выполнять до 300 последовательных действий это прямо рекорд И что важнее она не просто выполняет задачи но и задает новые стандарты в том как мы можем использовать ИИ в решении сложных проблем Во первых Kimi K2 Thinking может делать цепочки рассуждений искать писать код и вообще выполнять задачи которые раньше считались сложными для ИИ За счет увеличения количества токенов размышления и улучшения числа шагов при вызове инструментов модель буквально может думать дольше и точнее обеспечивая более глубокое понимание контекста На практике эта модель превзошла ожидания Вот несколько крутых достижений Humanity s Last Exam HLE Бенчмарк который оценивает логическое мышление на экспертном уровне по 100 дисциплинам K2 Thinking набрала 44 9 отличный результат для задачи где каждое слово на счету SWE Multilingual и SWE Bench Verified Рейтинг по задачам на кодинг и разработку ПО Тут K2 Thinking показала 61 1 и 71 3 соответственно что намекает на хорошие перспективы для работы с кодом на разных языках программирования Terminal Bench И снова 47 1 в задачах связанных с командной строкой и терминалом Модель находит решение и там BrowseComp Самый интересный момент На бенчмарке по поиску и навигации в интернете K2 Thinking набрала 60 2 что в два раза больше чем средний человеческий результат 29 2 Модель умеет эффективно искать анализировать и работать с интернет данными что делает её уникальной для работы в динамичных насыщенных информацией средах Основная фишка Kimi K2 Thinking может создавать сложные интерактивные приложения с нуля Например она генерирует код для популярных библиотек визуализации и результат просто впечатляющий Конечно для повседневной работы разработчиков такие примеры пока не идеально подходят но качество и уровень проделанной работы на данный момент на высоте Если вы работаете в ИТ сфере наверняка будете следить за этим релизом Особенно интересно как модель будет справляться с более сложными и динамичными задачами выходящими за пределы лабораторных тестов Data Science
Data Science | Machinelearning [ru]
26.10.2025 11:07
ИИ тоже могут потерять голову от думскролинга Исследователи из Техаса нашли интересную параллель между людьми и моделями ИИ Оказалось что если LLM обучать на низкокачественных данных например кликбейтах или вирусных постах из соцсетей то они начинают деградировать Это как если бы мы с вами слишком много думскролили теряя внимание и фокус Процесс был следующим взяли модель Llama 3 8B Instruct и начали дообучать её на коротких популярных постах с кучей лайков ретвитов и репостов Тема кликбейт и всякая ерунда И вот результат качество рассуждений модели упало с 74 9 до 57 2 а понимание длинных контекстов с 84 4 до 52 3 К тому же у модели появились странные черты вроде нарциссизма и психопатии Суть в том что тут не столько магия сколько смещение статистики Модели ИИ как и мы адаптируются к тому что они видят Если они обучаются на коротких эмоционально окрашенных сообщениях они начинают фокусироваться на последних нескольких словах а не на всей логической цепочке Это приводит к потере способности к долгим рассуждениям и называется это thought skipping думать поверхностно без глубины От того на чем модель обучается зависит насколько умной она будет А нам с вами похоже нужно меньше листать рилсы и больше думать Data Science
Data Science | Machinelearning [ru]
23.10.2025 19:07
OpenAI запустили собственный ИИ БРАУЗЕР Atlas ИИ ассистент будет теперь доступен везде так что ему можно будет поручать задачи или просить что то объяснить Плюс браузер будет подстраиваться под пользователя из за встроенной памяти Это новая эпоха поиска официально Будет доступно бесплатно на macOS xCode Journal
Data Science | Machinelearning [ru]
17.10.2025 18:37
Разработчики врут на собеседованиях больше всех Такую статистику показало новое исследование Больше половины работодателей в России сталкивались с приукрашенным резюме у кандидатов При этом чаще всего врут разработчики ПО за ними идут тестировщики и руководители проектов А вот меньше всего обманывают эйчаров датасаентисты аналитики сетевые инженеры и специалисты технической поддержки xCode Journal
Data Science | Machinelearning [ru]
29.09.2025 17:37
Google готовит революцию в мире машинного обучения SQL Python и Spark в одном месте По слухам Google разрабатывает новую интегрированную среду для специалистов по машинному обучению которая объединит SQL Python и Apache Spark в одном рабочем пространстве Это решение призвано устранить привычные проблемы с которыми сталкиваются аналитики и разработчики необходимость переключаться между различными инструментами и платформами Проблема которую решает Google Для большинства специалистов по данным процесс работы с машинным обучением выглядит так сначала они извлекают данные с помощью SQL из баз данных затем экспортируют их в Python чтобы настроить модели и наконец запускают вычисления на Apache Spark Это вызывает лишнюю путаницу задержки и дополнительные затраты времени Что меняет Colab Enterprise Google представил улучшенную версию своих блокнотов Colab Enterprise которая должна упростить этот процесс и предоставить единое рабочее пространство для всех нужных операций Предварительный просмотр ячеек SQL Теперь разработчики смогут работать с данными непосредственно в SQL не покидая рабочее окружение Colab Интеграция Data Science Agent Новый агент будет помогать в автоматизации анализа данных и разработки моделей машинного обучения значительно ускоряя процесс Почему это важно Эти улучшения значительно облегчают работу специалистов по машинному обучению устраняя необходимость в множественных экспортированных и импортированных данных между различными платформами Теперь процесс может быть сосредоточен в одном инструменте что повысит скорость разработки и улучшит взаимодействие с данными Google похоже готовит значительное упрощение для всех кто работает с данными Уменьшение необходимости в переключении между инструментами позволит ускорить рабочие процессы и улучшить производительность команд Как вы думаете поможет ли объединение в одной платформе ускорить процесс разработки Data Science
Data Science | Machinelearning [ru]
23.09.2025 12:07
Microsoft запускает самый мощный датацентр для ИИ в мире Fairwater AI Microsoft запустила строительство самого мощного датацентра для ИИ в мире Fairwater AI который будет расположен в Висконсине Эта установка не просто очередной шаг в развитии вычислительной инфраструктуры а настоящая революция способная обеспечить производительность в 10 раз превышающую возможности самого быстрого на данный момент суперкомпьютера На огромной территории в 127 гектаров разместится около 111 000 м² ранее принадлежащих Foxconn Это позволит создать уникальную платформу для обработки ИИ данных Для охлаждения будут использоваться высокоэффективные системы с замкнутым жидкостным контуром поддерживаемые гигантскими вентиляторами и водоохлаждающими чиллерами Данные в Fairwater будут передаваться через InfiniBand и Ethernet с пропускной способностью 800 Гбит с Интегрированная система которая объединяет несколько тысяч GPU NVIDIA GB200 соединённых в мощный кластер способный выполнять задачи синхронно В этом датацентре будут работать не только на тренировки ИИ но и на реальные вычислительные задачи такие как инференс и рилтайм обработку данных Microsoft планирует полностью запустить инфраструктуру к началу 2026 года Это будет не просто датацентр это глобальная сеть объединяющая более 400 центров по всему миру и Fairwater станет ключевым узлом в этой сети Задумайтесь насколько радикально изменится будущее ИТ инфраструктуры с такими проектами Мы стоим на пороге новой эры вычислений где мощность вычислительных кластеров будет определять не только скорость но и возможности ИИ в самых разных областях А вы что думаете Возможна ли революция Data Science
Data Science | Machinelearning [ru]
21.09.2025 19:07
100 готовых промптов для учебы от OpenAI OpenAI выпустили официальный набор из 100 промптов которые помогут студентам преподавателям и исследователям работать с нейросетями более эффективно Эти запросы могут быть полезны для создания курсовых дипломов исследований подготовки к экзаменам и многого другого Что включает в себя подборка Изучение предметов запросы для математики литературы науки и других областей Навыки обучения техники конспектирования запоминания и подготовки к экзаменам Карьерное развитие советы по составлению резюме подготовке к собеседованиям и профессиональным навыкам Хобби и интересы запросы для творчества и личного роста Также подходит для всех кто использует нейросети для обучения и развития и доступен бесплатно с возможностью перевода на другие языки что делает его универсальным решением для любой нейросети Data Science
Data Science | Machinelearning [ru]
20.09.2025 08:07
Модель OpenAI решила все 12 задач на финале ICPC 2025 Это абсолютный рекорд для ИИ модели и лучший результат на Олимпиаде Следующие в рейтинге идут наши ребята из СПБГУ они решили 11 задач из 12 Также 1 место получила Gemini 2 5 DeepThink от Google решившая 10 из 12 задач xCode Journal