Аватар автора

ML_secrets

tech

8682 Подписчиков
32 Сообщений
10 Показано сообщений
Не указана Дата добавления
ГлавнаяАвторыML_secrets

Информация об авторе

Категория: tech

Последние сообщения автора

Аватар
DeepSeek инвестиции вычислительные мощности и недостатки технологии Китайский стартап DeepSeek представил модель R1 Она стала полноценным конкурентом для o1 от OpenAI и других известных моделей Компания заявила что обучение DeepSeek R1 с 685 млрд параметров потребовало всего 2 048 ИИ ускорителей NVIDIA H800 и обошлось в 5 6 млн Инвесторы задались вопросом действительно ли нужно вкладывать миллиарды в разработку искусственного интеллекта или можно обойтись значительно меньшими вливаниями Machine Learning
Открыть в Telegram → Открыть новость на сайте →
Аватар
Обновление ИИ агента Яндекс Маркета распознавание товаров по фото персонализация и сравнение по характеристикам Маркетплейс запустил чат на базе Alice AI теперь ИИ агент помогает находить товары по изображениям подбирает подарки через уточняющие вопросы и персонализирует выборки на основе истории покупок Архитектура VLM для распознавания фото нейросети для обработки запросов поиск по каталогу и в сети с фильтрацией по личным предпочтениям Можно сфоткать рубашку и попросить подобрать низ показать комнату получить диван в том же стиле попросить помочь с подарком агент задаст вопросы про возраст и увлечения Сохраняет контекст диалогов можно продолжить предыдущие поиски До конца года обещают прикрутить голосовые запросы Machine Learning
Открыть в Telegram → Открыть новость на сайте →
Аватар
RecSys R&D команда из Яндекса разработала новую рекомендательную систему на базе больших генеративных моделей ARGUS AutoRegressive Generative User Sequential modeling — новое поколение рекомендательных моделей, которые способны предсказывать потребности пользователей и их отклик, а также находить сложные взаимосвязи между событиями. Это значительно повышает точность и качество рекомендаций. Алгоритмы анализируют агрегированные и обезличенные данные. Подобные системы сейчас внедрены всего у нескольких компаний в мире, включая Google и Netflix. Архитектура Argus — двухбашенная модель, для которой, в отличие от target-aware постановки ранжирования в HSTU, можно в оффлайне пересчитывать векторы для миллионов пользователей и айтемов. Для оценки качества используется global temporal split, а на этапе предобучения смотрят прежде всего на значения функции потерь для задач next item prediction и feedback prediction. На этом же этапе сравнивают продовый градиентный бустинг, обученный на новых данных, с версией этого бустинга, в которую входит признак от ARGUS. И вместо абсолютных значений приводят относительный прирост метрики Первыми новую модель интегрировали в Яндекс Музыку. В рекомендации сервиса внедрили модель с длиной истории 8192 в терминах события в жизни пользователя . Это прецедентный случай внедрения модели подобных масштабов с такой длинной истории музыкальных рекомендаций. По статистике стриминга, слушатели Моей волны стали лайкать впервые услышанные треки на 20% чаще, а разнообразие рекомендаций возросло на 14%. При этом, генеративные нейросети в рекомендациях позволяют учитывать предпочтения пользователей не раз в сутки, а в режиме реального времени, что выводит качество персонализации на новый уровень. Следом за Яндекс Музыкой, технологию интегрировали в Маркет. Со временем на рекомендательные алгоритмы нового поколения перейдут и другие сервисы компании.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Нейросеть A-Vibe от Авито доказала, что российские разработки в области ИИ могут конкурировать с мировыми лидерами. Заняв первое место в бенчмарке MERA среди легких моделей, она превзошла решения от OpenAI, Google и Anthropic по ключевым параметрам работы с русским языком: — генерация кода: на 25% лучше Gemini 1.5 — ведение диалога: на 32% точнее Llama 3.1 — способность анализировать смысл текста: на 23% точнее Claude 3.5 Haiku Достичь таких результатов удалось благодаря внедрению собственного токенизатора, заточенного под русский язык: он позволил модели обрабатывать текст в 2 раза быстрее, а также лучше понимать и генерировать материал. В ближайших планах — внедрение в функционал 20 новых сценариев. А в будущем Авито может выложить код модели в открытый доступ: «Это поможет малому бизнесу внедрять передовые технологии без значительных инвестиций, образовательным учреждениям создавать прикладные программы, а независимым разработчикам строить современные сервисы на базе отечественных технологий. Для нас это возможность получить ценную обратную связь от рынка и улучшить наши модели», — отметила Анастасия Рысьмятова, руководитель разработки больших языковых моделей «Авито». Чтобы увидеть актуальный рейтинг, в фильтре «Размер модели» нужно выбрать «≥5B — 10B». Это значит, что в рейтинг попадут модели размером от 5 до 10 миллиардов параметров. Цифры Human Benchmark — это реальные результаты людей. Языковые модели приближаются к этим значениям, но окончательно превзойти человека ещё не смогли. Machine Learning
Открыть в Telegram → Открыть новость на сайте →
Аватар
DeepSeek: инвестиции, вычислительные мощности и недостатки технологии Китайский стартап DeepSeek представил модель R1. Она стала полноценным конкурентом для o1 от OpenAI и других известных моделей. Компания заявила, что обучение DeepSeek R1 с 685 млрд параметров потребовало всего 2 048 ИИ-ускорителей NVIDIA H800 и обошлось в 5,6 млн $. Инвесторы задались вопросом: действительно ли нужно вкладывать миллиарды в разработку искусственного интеллекта или можно обойтись значительно меньшими вливаниями? Machine Learning
Открыть в Telegram → Открыть новость на сайте →
Аватар
В 2025 крипта станет нишей заработка №1 — всё из-за прихода Трампа к власти. Всё, что вам нужно — забыть про биткоин и обратить внимание на монеты, которые дадут х3, х5 и даже х15. Вложили 5000₽ — через месяц получили 75 000₽. Для этого не нужно шарить в крипте и потратить сотню часов на обучение — просто почитайте канал Главный по мемкоинам Он сам поднялся на крипте, а теперь на простых примерах поясняет новичкам, откуда в ней деньги и с чего начать новичку без гроша в кармане. Внутри: бесплатный гайд по заработку первых 100к на криптовалюте, словарь терминов для новичка, мануал по поиску проектов с потенциалом взлёта х10-15 и многое другое. Подписывайтесь и кликайте на закреп — там всё нужное для старта: Реклама. ИП Коток А.В., ИНН 504710200005
Открыть в Telegram → Открыть новость на сайте →
Аватар
YandexGPT 4: что умеет новая линейка нейросетей Яндекса? Более мощная YandexGPT 4 Pro и облегченная YandexGPT 4 Lite уже доступны на сайте Yandex Cloud. Модель Pro в 70% случаев лучше своей прошлой версии справляется с запросами. А благодаря увеличенной обработке до 32 тысяч токенов модели лучше работают с длинными запросами и внешними источниками в RAG-сценариях, а еще анализируют большие объемы данных. Про обучение YandexGPT 4 и ее отличия от предыдущих версий разработчики рассказали в статье на Хабре. Machine Learning
Открыть в Telegram → Открыть новость на сайте →
Аватар
Яндекс продлевает Квалификацию на международный чемпионат по программированию Yandex Cup 2024 для ML-направления. Призовой фонд — 12,5 млн рублей! В этом году участники погрузятся в древние эпохи и попробуют решить задачи цивилизаций прошлого с помощью IT. На картинках — примеры таких ситуаций: настроить систему разгрузки драккаров в порту викингов, помочь композитору в создании алгоритма для написания музыки, придумать систему архивации табличек астрономов династии Хань или придумать систему регулировки в средневековой Венеции. Не упускай шанс показать свой скилл — подать заявку на направление по машинному обучению можно до 4 ноября на сайте чемпионата.
Открыть в Telegram → Открыть новость на сайте →
Аватар
Нейроредактор в Яндекс Браузере: как «прокачали» LLM-модель семейства YandexGPT для работы с текстом Яндекс Браузер усовершенствовал нейроредактор на базе YandexGPT — теперь это отдельный ИИ-инструмент для создания текстов с нуля и улучшения готовых исправление ошибок, переписывание в определенном стиле и формате . Это один из самых масштабных нейросетевых проектов Браузера, объединивший усилия команд фронтенда, бэкенда, менеджмента и ML-специалистов. Для оценки разницы в версиях использовалась диффалка на Go, работающая на основе алгоритма поиска наибольшей общей подпоследовательности LCS . Сравнивая результат модели с корректным вариантом от редактора, диффалка считает количество не исправленных ошибок и позволяет проверять гипотезы о качестве. Эксперименты с обучением моделей для нейроредактора переход к архитектуре Encoder-Decoder, curriculum learning с постепенным усложнением примеров, предобучение на "грязном" датасете с искусственными ошибками дали ускорение генерации в 2 раза без потери качества и в среднем +10% качества на открытых датасетах. Нейроредактор также получил надежную поддержку Маркдауна благодаря обучению на размеченных текстах, восстановлению пропущенных символов разметки и переобучению. Machine Learning
Открыть в Telegram → Открыть новость на сайте →
Аватар
Исследование ИТМО: тренды Open Source в ML/Data в России Выяснилось, что по количеству проектов и их использованию лидируют Яндекс, Сбер и Т-банк. Исследование показало, что компании-разработчики открытых решений нацелены на международный рынок и все чаще рассматривают вклад в опенсорс как инструмент развития отрасли. Лидер рейтинга, Яндекс, предоставляет 120 открытых решений. Среди них выделяются CatBoost — библиотека градиентного бустинга, YTsaurus — платформа для обработки больших данных, и YDB — распределенная SQL база данных. Machine Learning
Открыть в Telegram → Открыть новость на сайте →
1