26 сентября, 15:15
Т Технологии представили крупнейший кросс-доменный датасет для рекомендательных систем в e-commerce


Про tech и этих
По данным McKinsey компании активно использующие data driven подход принимают решения в 5 раз быстрее и в 3 раза эффективнее своих конкурентов А IDC прогнозирует что к 2025 году объем данных генерируемых пользователями превысит 180 зеттабайт Но доступ к этим данным по прежнему привилегия немногих Особенно когда речь идет о репрезентативных чистых и кросс доменных выборках для реального бизнеса И вот сегодня Т Технологии выложили в открытый доступ один из самых масштабных датасетов в мире для рекомендательных систем в e commerce T ECD В нем 44 миллиона уникальных пользователей 135 миллиардов взаимодействий и 30 миллионов товаров Там обезличенные данные из экосистемных сервисов Т Банка о транзакциях чеках отзывах взаимодействиях с рекомендациями активациях кэшбэков и спецпредложений все анонимизировано но связано между собой ключами пользователей и товаров Глубина данных достигает 3 5 лет Фактически это теперь первый в мире датасет по объему связанных между собой данных Лицензия свободная можно брать и использовать для бизнеса если знаете как Читайте Про tech и этих
Технологии56 дней назад


Хайтек
Т Технологии открыли T ECD крупнейший кросс доменный датасет для рекомендательных систем 44 млн пользователей 30 млн товаров и 135 млрд взаимодействий теперь доступны исследователям на Hugging Face
Технологии56 дней назад


Data Secrets
Новый датасет T ECD для екома Т выкатили не просто датасет а крупнейший кросс доменный набор для развития рексистем Основной T ECD более 135 млрд взаимодействий данные на основе 44 млн пользователей 30 млн товаров и 1 2 млн брендов Сборка данных глубиной от 1 до 3 5 лет доступны краткосрочные и долгосрочные пользовательские истории Домены Marketplace Retail Payments Offers и Reviews Рекомендательные задачи подходит для next item next basket session based топ N и других Версии полный датасет и T ECD Small на 5 млрд событий а также облегчённый набор на 1 млрд взаимодействий для быстрых экспериментов Почти все доступные датасеты для исследований моно доменные и маленькие а Т ECD первый по настоящему кросс доменный датасет такого масштаба Он универсален можно использовать как целиком так и по доменам а еще подходит для разных подходов от базовой коллаборативной фильтрации до графовых рекомендаций Всё это уже доступно на Hugging Face под Apache 2 0
Технологии56 дней назад
Похожие новости



+5



+8



+7
![Аватар Телеграм канала: TechGPT [🅽 🅴 🆆 🆂] 🤖](https://content.tek.fm/1126c3ac-a5f8-4632-911f-265d77495c49.jpg)




+8



+3

Группа ВЭБ и партнеры представили новые инициативы для поддержки экономики и доступного спорта
Общество
1 день назад


+5
Рост популярности российских нейросетей: Яндекс сообщает о значительном увеличении пользователей Алисы AI
Технологии
17 часов назад


+8
Финансовые отчеты и дивиденды: ключевые события октября 2025 года
Экономика
1 день назад


+7
На конференции AI Journey 2025 представлена международная база ИИ кейсов Success Hub для стран БРИКС
Технологии
1 день назад![Аватар Телеграм канала: TechGPT [🅽 🅴 🆆 🆂] 🤖](https://content.tek.fm/1126c3ac-a5f8-4632-911f-265d77495c49.jpg)

Промомед сообщает о росте выручки на 78% за 9 месяцев 2025 года
Экономика
1 день назад


+8
Региональный парламент поддержал законопроект о туристских агрегаторах
Политика
20 часов назад


+3