ТЕХНО: Яндекс про технологии
17.04.2024 16:04
Вчера компания Boston Dynamics объявила о закрытии проекта Atlas, который занимается созданием человекоподобных роботов. А уже сегодня выяснилось, что это был пиар-ход, приуроченный к выходу нового поколения Atlas. В новом Atlas используются электромоторы предыдущие модели были гидравлическими , благодаря которым он стал сильнее и манёвреннее, научился эффектно двигаться, гнуться и подниматься из разных положений. В планах компании — развивать эту модель для работы в разных сферах. В том числе вместе с компанией Hyundai, которая будет использовать новых роботов на своих автомобильных заводах. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке Подписывайтесь
ТЕХНО: Яндекс про технологии
09.04.2024 08:14
В Яндекс Картах появился персонализированный режим «Идеи», предлагающий пользователю кафе, бары и рестораны, которые понравятся именно ему. В основе «Идей» — новая рекомендательная технология Яндекса. Она изучает поведение пользователя с помощью ML-моделей и на основе этих данных выбирает из организаций, отмеченных на Картах, наиболее подходящие. Объясняем, как это работает. Находим главные характеристики места Модель выделяет главные свойства заведения. Для ресторана, например, это тип кухни, атмосфера, наличие веранды, вежливые официанты, вкусные десерты, красивый вид из окон. Всё это модель находит в фотографиях, видео и отзывах, которые пользователи оставляют в карточках заведений. Изучаем предпочтения пользователя Другая модель пытается понять, какие заведения нравятся пользователю: анализирует места, в которые он ходит, и отзывы, которые оставляет. Так модель составляет картину предпочтений. Например, выясняет, что пользователь чаще посещает места с фильтр-кофе и необычным интерьером. Сопоставляем первое и второе Теперь ML-моделям остаётся лишь сопоставить предпочтения пользователя и свойства организации, чтобы найти те, у которых больше совпадений. При этом учитываются более 600 факторов. Анализируя их, модель достаточно точно предсказывает, насколько то или иное место понравится конкретному человеку. Уточняем запрос Сделать рекомендацию точнее помогают интенты — запросы, уточняющие сценарий поиска например, «поесть», «выпить», «перекусить» . В этом случае модель сначала собирает места, которые соответствуют запросу, а потом сверяет их с пользовательскими предпочтениями. Также помогают лайки и дизлайки: модель обучается на них и лучше понимает, что можно советовать чаще, а что убрать из рекомендаций. Выводим заведения на карту Включив режим «Идеи» в Яндекс Картах, пользователь получит рекомендации мест, расположенных неподалеку, с коротким описанием и информативной картинкой. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке Подписывайтесь
ТЕХНО: Яндекс про технологии
31.03.2024 07:21
Технодайджест недели OpenAI показала первые ролики, созданные художниками с помощью нейросети Sora. Ранее компания выкладывала «сырые» ролики, сгенерированные нейросетью, а теперь показала, как профессионалы в области видео и графики могут использовать её в своей работе и творчестве. Один из примеров — короткометражный фильм канадской студии shy kids, рассказывающий о человеке с воздушным шариком вместо головы. Яндекс представил языковую модель YandexGPT 3 Pro. Она эффективнее решает сложные задачи, лучше учитывает контекст диалога и в целом показывает существенно более высокое качество работы по сравнению с YandexGPT 2. Модель доступна для использования в сервисах и приложениях через API. Geely научила беспилотный автомобиль дрифтовать на снегу. Компания показала ролик, в котором прототип электромобиля на новой платформе передвигается по снегу в управляемом заносе без водителя за рулём. Databricks представила лучшую открытую языковую модель DBRX. На ключевых бенчмарках DBRX обошла все открытые языковые модели, а также GPT-3.5 от OpenAI. DBRX основана на архитектуре MoE, в которой вместо одной большой нейросети используется набор меньших по размеру. Каждый токен слово или его часть обрабатывается лишь некоторыми из них, что позволяет использовать меньше вычислительных ресурсов во время работы. OpenAI представила систему клонирования голоса Voice Engine. Ей достаточно показать 15-секундный пример, после чего она может генерировать новую речь таким же голосом. OpenAI рассказала, что создала Voice Engine ещё в 2022 году и с тех пор использовала её для синтеза речи в приложении ChatGPT и TTS API, а также предоставила некоторым компаниям. В частности выяснилось, что сервис HeyGen, переводящий видео с сохранением голоса, работает на основе Voice Engine. Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке Подписывайтесь
ТЕХНО: Яндекс про технологии
10.03.2024 09:02
Технодайджест недели Главной техноновостью этой недели стал выход семейства языковых моделей Claude 3 от компании Anthropic. Они различаются между собой качеством ответов, скоростью работы и стоимостью. В отличие от Claude 2.1, третья версия способна работать не только с текстом, но и с изображениями. Главным отличием от GPT-4 стало большое окно контекста, позволяющее работать с книгами, научными статьями и другими объёмными документами. Все версии Claude 3 могут принимать текст длиной 200 тысяч токенов, а Claude 3 Opus — самая «умная» из трёх — до миллиона токенов правда, опция доступна только по запросу . Для сравнения: у GPT-4 Turbo размер контекста составляет 128 тысяч токенов. Anthropic утверждает, что Claude 3 Opus превзошла GPT-4 при сравнении на ключевых бенчмарках. Вскоре после релиза модель добавили на LMSYS Chatbot Arena — сервис, в котором люди получают ответы на свои запросы от двух нейросетей и выбирают из них лучший. На основе этих данных и рейтинга Эло строится список лучших моделей. На текущий момент Claude 3 Opus немного отстаёт в рейтинге от актуальных версий GPT-4. Другие новости недели, которые показались нам интересными: CloudFlare разработала файрвол для языковых моделей. Он включает в себя как защиту от DDoS, так и анализ текста в запросах пользователей и ответах нейросети. Это должно защитить сервис от методов, позволяющих обходить стандартные ограничения нейросетей с помощью специальных промптов. Wix выпустила нейросетевой генератор веб-страниц. Чат-бот задаёт несколько вопросов о сайте и создаёт первую версию страницы, которую можно редактировать — тоже через разговор с чат-ботом. Кроме того, страницу можно наполнить контентом с помощью нейросетей для генерации текста и изображений. Американские инженеры научились управлять человекоподобными роботами без датчиков захвата движения. Алгоритм распознаёт движения человека на кадрах с камеры и в реальном времени превращает их в команды для робота. Подписывайтесь Не пропускайте новости Яндекса тут
ТЕХНО: Яндекс про технологии
03.03.2024 07:31
Технодайджест недели На этой неделе прошла MWC — одна из главных ежегодных выставок мобильных технологий. Рассказываем о самых интересных гаджетах с неё. Прозрачный ноутбук от Lenovo. На месте привычного экрана в нём установлен прозрачный MicroLED-дисплей с диагональю 17,3 дюйма. А вместо обычной клавиатуры в ноутбуке плоская сенсорная панель: на неё можно вывести виртуальные клавиши, также её можно использовать вместе со стилусом как графический планшет. «Смартфоночасы» от Motorola и Samsung. Компании показали похожие прототипы, которые сложно отнести к одному классу устройств. В обычном положении они оба выглядят как привычные смартфоны, разве что более вытянутые. Но дисплей в них гнётся сразу в нескольких местах, поэтому их можно обернуть вокруг руки и носить вместо умных часов: в прототипе от Samsung даже встроен датчик пульса на задней стороне. Нейротелефон от Deutsche Telekom и Brain.ai. Компании привезли на MWC концепт смартфона, в котором нет приложений — все действия можно выполнить через нейросетевого помощника. Он сам выполняет в фоне промежуточные шаги, собирает информацию с разных сервисов и генерирует оптимальный интерфейс. По сути, это аналог Rabbit R1, показанного на CES 2024, но в привычном форм-факторе смартфона. Прототип минималистичных AR-очков Oppo Air Glass 3. Они выглядят практически как обычные очки, но оснащены проекторами, которые выводят перед глазами информацию, например, уведомления или список дел. А ещё в них есть камера и доступ к мультимодальной нейросети, которую можно спрашивать об объектах перед собой. Умные часы OnePlus Watch 2. Они стали первыми, использующими новую гибридную платформу Wear OS. В них есть два процессора и две ОС: каждая оптимизирована для фоновой или активной работы. В новой версии Wear OS разработчикам из Google и OnePlus удалось перенести многие задачи, в том числе уведомления, на энергоэффективную часть гаджета. Это позволяет ему работать до 100 часов. Подписывайтесь Не пропускайте новости Яндекса тут
ТЕХНО: Яндекс про технологии
25.02.2024 07:21
Технодайджест недели Одной из самых обсуждаемых техноисторий недели стало поведение чат-бота Google Gemini при генерации изображений людей. Пользователи заметили, что Gemini генерирует картинки с людьми разного пола и расы при практически любых запросах, даже если результаты получаются исторически недостоверными. Так, пользователи публиковали скриншоты, на которых чат-бот создавал картинки темнокожих викингов, римских императоров и американских сенаторов XIX века в ответ на запросы, в которых не было уточнений про расу и цвет кожи. Кроме того, Gemini часто отказывался генерировать изображения по промптам, в которых пользователи просили нарисовать людей со светлой кожей. Вскоре Google признала проблему и отключила возможность генерировать изображения людей. Компания пообещала доработать эту функцию и вернуть её, когда убедится, что она работает существенно лучше. Другие новости недели, которые показались нам интересными: Робопса ANYmal научили скакать на трёх ногах и открывать двери четвёртой. Швейцарские инженеры создали нейросетевой алгоритм управления роботом, позволяющий ему использовать одну из ног для взаимодействия с предметами. В одном из экспериментов он поднял свободной ногой рюкзак и положил его в корзину. Apple внедрила в iMessage квантово-устойчивый алгоритм шифрования. Такие алгоритмы, предположительно, устойчивы к атакам с помощью мощных квантовых компьютеров будущего, которые будут способны быстро расшифровать данные, защищённые классическими криптографическими алгоритмами. Ранее аналогичный алгоритм внедрил мессенджер Signal. Google выложила в открытый доступ две большие языковые модели Gemma. Их архитектура и параметры обучения аналогичны таковым у Gemini, но размер существенно меньше. Это позволяет запускать их локально на многих компьютерах, а версию 2B — даже на смартфоне. По качеству работы Gemini 7B сопоставима с Mistral 7B правда, имеет больший размер . Чтобы открыть истории, нам нужны ваши голоса. Если у вас оформлен Telegram Premium поддержите наш канал по ссылке.
ТЕХНО: Яндекс про технологии
30.01.2024 16:18
Первые обзоры Apple Vision Pro: за что хвалят и ругают устройство Apple анонсировала свой шлем смешанной реальности ещё прошлым летом и с тех пор провела несколько демонстраций для журналистов. Но сегодня, за три дня до начала продаж, вышли первые полноценные обзоры от ведущих технологических изданий и блогеров, которые пользовались гаджетом на протяжении нескольких дней. Пересказываем ключевые моменты из их материалов. Все отметили высочайший уровень материалов и дизайна самого шлема и остальных комплектующих, включая сменные крепления и чехол. Но шлем постоянно напоминает о себе своим весом — «это iPad для вашего лица». The Verge взвесила устройство: 600-650 весит грамм сам шлем, в зависимости от типа ремешка, и ещё 353 грамм — аккумулятор, от которого он получает питание. У Apple Vision Pro лучшее качество дисплеев по сравнению с конкурентами, но угол обзора немного меньше, чем в Quest 3 от Meta признана экстремистской организацией и запрещена в РФ . Он ощущается так, будто смотришь на мир через бинокли или маску для плавания с чёрными областями по краям. Все издания отмечают очень высокое качество сквозного режима, в том числе в сложных условиях, например, когда человек в шлеме повёрнут лицом к окнам с ярким дневным светом. Но, по словам главреда The Verge Нилая Патела, «Vision Pro постоянно напоминает, что ты смотришь на видео на экранах». Отслеживание рук и взгляда работает хорошо, но оно не всегда практично и вряд ли способно заменить мышку и клавиатуру для работы. Их, кстати, можно подключить благодаря удобной интеграции с компьютерами Mac, но использовать можно только один монитор на самом шлеме можно запускать несколько приложений . В целом издания сошлись во мнении, что Apple Vision Pro — это лучший шлем смешанной реальности на текущий момент и девайс, часто вызывающий восторг, но у него всё ещё слишком много компромиссов, чтобы его можно было посоветовать обычному человеку, даже если не учитывать огромную цену. Подписывайтесь Не пропускайте новости Яндекса тут
ТЕХНО: Яндекс про технологии
30.01.2024 10:31
На днях стартуют продажи шлема смешанной реальности Apple Vision Pro. Одна из его самых впечатляющих функций — сквозной режим Passthrough , позволяющий видеть приложения, виртуальные телевизоры и другие объекты, встроенные в окружающий мир так, будто они реальны. Разбираемся, как это работает и что даёт пользователям. Что такое сквозной режим? В шлемах смешанной реальности mixed reality, MR есть камеры на корпусе, направленные на окружающий мир. В сквозном режиме шлем выводит изображение с камер на экраны, позволяя человеку как бы видеть сквозь непрозрачный корпус. Но просто выводить кадры с камер недостаточно: камеры располагаются в 2–3 см от глаз, поэтому картинка снимается с непривычного для мозга ракурса. Из-за этого во многих но не всех MR-шлемах используется метод репроецирования изображения. Шлем с помощью камер или лидара создаёт карту глубины она показывает, на каком расстоянии от шлема находятся объекты вокруг , и каждый кадр с камер искажается с учётом этой карты так, чтобы он выглядел снятым с того же ракурса, что и глаза пользователя. Все эти процессы происходят в реальном времени, как правило, с частотой 90 раз в секунду. Зачем нужен сквозной режим? Сквозной режим позволяет совмещать в устройстве лучшие свойства VR и AR: шлем может работать в обычном VR-режиме, в котором человек полностью погружён в виртуальный мир, а если нужно, можно включить Passthrough и видеть мир вокруг почти так же, как и без шлема, но с виртуальными объектами, например, парящими в воздухе окнами приложений. А ещё сквозном режиме можно взаимодействовать с реальным миром: взять кружку с кофе или ответить на сообщение на смартфоне. Это технология Apple? Этот режим в том или ином виде уже есть в других шлемах, таких как Quest 3 от Meta признана экстремистской организацией и запрещена в РФ , Pico 4 или Varjo XR-4. Но, судя по тестам журналистов, в Apple Vision Pro он реализован качественнее, а картинка в нём ещё ближе к реальности. Подписывайтесь Не пропускайте новости Яндекса тут
ТЕХНО: Яндекс про технологии
27.01.2024 07:08
Технодайджест недели Главной техноновостью недели стало то, что Apple разрешит использовать на iPhone сторонние магазины приложений, способы оплаты в том числе через NFC и браузерные движки. Это выглядит как крупнейшее изменение платформы за долгие годы, но есть важные нюансы. Новые возможности — реакция Apple на регулирование мобильных платформ в ЕС, поэтому и действовать они будут только для пользователей из ЕС. Но даже в Европе они могут оказаться далеко не такими полезными для разработчиков и пользователей, как кажется на первый взгляд. Дело в том, что Applе предусмотрела большое количество ограничений. Вот лишь некоторые из них: Альтернативные магазины будут проходить процесс одобрения Apple Каждое приложение в альтернативном магазине тоже будет проходить проверку. Но требования к контенту в них будут не такими строгими, как в App Store Разработчики бесплатных приложений, достигших миллиона установок в год, будут платить Apple 50 евроцентов за каждую следующую установку. Крупные разработчики отозвались о нововведениях так: Spotify назвала их «абсолютным фарсом», глава Epic Games — недобросовестным соблюдением закона при этом компания обещает запустить в этом году Epic Games Store и Fortnite для iOS , а Mozilla заявила, что новые правила делают создание альтернатив Safari «максимально болезненным». Другие новости недели, которые показались нам интересными: Google добавила в Chrome нейросетевые функции. Браузер сможет объединять в группы вкладки с похожим контентом, а в полях ввода появится нейросеть для генерации текста. В бета-версии iOS 17.4 обнаружили упоминания локальной языковой модели. Исследование кода ОС показало, что она сможет суммаризировать тексты и генерировать ответы на сообщения в iMessage. Исследователи из Google создали нейросеть Lumiere для генерации видео. Она создаёт реалистичные ролики по текстовому описанию, оживляет картинки или их части и умеет стилизовать видео по показанной картинке. Подписывайтесь Не пропускайте новости Яндекса тут
ТЕХНО: Яндекс про технологии
22.01.2024 11:44
Пока все создают VR-шлемы, Disney разработал VR-пол Человек с VR-шлемом может ходить по такому полу — перемещаясь по виртуальному миру, но в реальном оставаясь на месте благодаря крутящимся роликам. Пока это лишь прототип, но у инженеров уже есть несколько идей, как такие полы можно использовать в будущем. Подписывайтесь