эйай ньюз
07.01.2025 03:05
RTX 5090 за $2000 - Nvidia показала 5000 серию видеокарт Хуанг с барского плеча закинул в 5090 32 гигабайта видеопамяти с 1.8TB/s пропускной способности. По остальным характеристикам она в 1.5x-3x быстрее чем 4090. Не забыли и про сегменты подешевле - в RTX 5070 обещают уровень производительности 4090, при этом новые видяхи стоят дешевле 4000 серии. У новых видях гора новых фич для геймеров - DLSS 4 теперь работает на основе трансформера, а не CNN, генерация кадров теперь генерит три промежуточных кадра вместо одного. Текстуры и материалы теперь сжимаются при помощи нейронок - теперь они потребляют вплоть до 3x меньше памяти. Нужно ждать независимых обзоров, но пока что поколение выглядит очень интересно. Ждём релиза 30 января.
эйай ньюз
20.12.2024 20:03
Прогнать o3 на ARC-AGI стоит до полутора миллиона долларов OpenAI запретили публиковать такие цены напрямую, но high-compute режим использует в 172 раза больше вычислений чем low-compute режим, цену которого мы уже знаем 8689 долларов .
эйай ньюз
19.12.2024 14:34
ElevenLabs Flash 2.5 Звук генерится всего за 75 миллисекунд, предназначено это для риалтайм разговоров с ИИ. Доступно только по API, а жаль, локальный хостинг позволил бы срезать несколько десятков миллисекунд сетевой задержки. Хоть задержка у сетапа на основе такой модельки будет заметно побольше но не факт , чем у омни-моделей вроде GPT-4o или Gemini 2.0 Flash, но тут больше и контроля - одни кастомные голоса чего стоят.
эйай ньюз
18.12.2024 13:00
Тут по интернету пронеслась новость о том, что ключевой свидетель в деле против OpenAI о нарушении авторского права и бывший сотрудник все той же компании был найден мертвым у себя дома совпадение? . Конечно же, бравые СМИ недвусмысленно прогремели тревогу, мол, смотрите, корпорация зла наняла хитмэна, чтобы сделать всё "чисто". Очевидно, что это всё байт на классы: никто никого в таком деле не стал бы убивать. Ведь всем и так понятно, что данные парсят со всего интернета. Вопрос лишь в том, является ли это fair use или нет. Пока никакого четкого закона на этот счёт нет, и, надеюсь, не будет, потому что запретить парсить интернет — значит убить всю индустрию AI в своей стране. Никакие "пруфы" от инсайдера о том, что OpenAI крадёт чужие работы, этого не изменят. Его главный довод из интервью с NYT: The outputs aren’t exact copies of the inputs, but they are also not fundamentally novel. Но разве хоть кто-то когда-либо писал что-то совершенно новое? Семье погибшего — мои соболезнования.
эйай ньюз
16.12.2024 21:01
Veo 2 — новая SOTA видео-генерация?! Google стратегически дождались релиза Sora от OpenAI, чтобы сразу представить свою ответку. По их внутренним тестам, Veo 2 заметно опережает конкурентов. Правда, я бы не стал слепо доверять их тестам, согласно которым клинг чуть ли не лучше MovieGen и Sora. Однако, черрипики на сайте выглядят впечатляюще. Как минимум, фламинго не путает передние и задние ноги и Veo 2 почти безошибочно справился с фигуристкой. Но с более динамичными сценами пока есть трудности, о чём сами признаются в DeepMind — см. пример со скейтбордистом. Технических деталей немного, кроме того, что модель на релизе выдаёт разрешение 720p с возможностью дойти до 4К! Длина видео — 8 секунд, золотая середина между 5-ю и 10-ю секундами, где уже чаще возникают артефакты. Картинки на вход, вроде бы, пока не принимает. Есть даже регистрация в вейтлист, правда чтобы туда добавили просят заполнить небольшую анкету, да и сколько ждать — неизвестно. Надеюсь, гугл не будет опять годами держать модель за семью печатями.
эйай ньюз
13.12.2024 14:40
Android XR - новая ОС гугла для AR/VR девайсов Скейлится она должна на всё: от девайсов попроще, до полноценных конкурентов Apple VIsion Pro. Киллер фичей ОС должна стать возможность взаимодействовать с видео-режимом Gemini прямо с очков, так нейронка всегда сможет видеть то же что видит пользователь. Первым девайсом на Android XR будет Project Moohan от Samsung, который запустится уже в следующем году. Девайс без стыда копирует Vision Pro - схожий дизайн, внешняя батарея, хайенд фичи вроде отслеживания глаз и MicroOLED дисплеев. Производители поменьше, вроде Sony и Lynx, тоже готовят свои устройства. Превью SDK уже доступно - хоть большинство приложений для Android будут работать без изменений, в систему докинули ряд новых API для создания приложений для хедсетов. В основе их лежит OpenXR, хотя поверх него докинули несколько проприетарных расширений. Новую ОС уже поддерживает Unity, от Epic с их Unreal пока ничего не слышно. Непонятно хватит ли тут гугла надолго - 10 лет назад они пару лет пытались заниматься VR, но идею быстро забросили. А ещё ведь было фиаско с Google Glass. То же самое можно сказать и про Samsung - пару устройств они выпустили, но долгосрочного интереса не проявляли - последний шлем от Samsung вышел в 2018. С фичами Project Moohan, цена явно будет выше $1500, даже если они будут продавать их по себестоимости. С такими ценами речи о многомилионных продажах, которые нужны чтобы отбить стоимость разработки, идти не может, так что придётся работать себе в убыток. Сколько времени, как Google, так и производители девайсов, готовы их терпеть - вопрос.
эйай ньюз
12.12.2024 18:25
Всего через сутки после превью гугла, OpenAI запускают свой видео-режим На этот раз оно будет нормально доступно как в приложении ChatGPT, таки и в браузере. С Advanced Voice Mode всё будет поприятнее - 4o нормально говорит на русском, да и как моделька она поумнее чем Gemini 2.0 Flash. Из преимуществ, которые остались у превью гугла - доступ в интернет и тулз. Ну, и длина контекста заметно выше - млн токенов у Gemini против всего 128к у OpenAI. Раскатывать уже начали, но займёт это где-то неделю. А пока можно потыкать гугловую или просто пообсуждать новые свитеры в комментах.
эйай ньюз
11.12.2024 23:02
Из всего что релизнул гугл с Gemini 2.0, самое впечатляющее - демка их streaming API. Gemini теперь в риалтайме понимает одновременно и аудио и видео - как с камеры, так и стрим экрана. К тому же может отвечать голосом пусть и с помощью TTS . А ещё может исполнять код и искать по интернету, в отличие от advanced voice mode. Такого вау-эффекта от новых возможностей нейронок у меня не было, пожалуй, с релиза advanced voice mode, всем советую попробовать обязательно врубите стрим либо с экрана либо с камеры . Можно ненадолго почувствовать себя как в фантастике, пока это не стало обыденностью. Доступно бесплатно, но нужен VPN не европейский .
эйай ньюз
11.12.2024 20:39
На стриме OpenAI в этот раз было как-то совсем грустно В этот раз показали даже не свои фичи, а уже релизнутые интеграции продуктов Apple с ChatGPT. Показали их ещё в июне, а релизнули лишь на днях. Зато свитеры красивые.
эйай ньюз
10.12.2024 18:22
OpenAI сильно улучшили Canvas Canvas - это тулза для совместного редактирования вместе с ChatGPT, где вы можете вносить правки в текст или код как вручную, так и попросив ChatGPT. Его пару месяцев тестировали, а уже сегодня добавят в основную модель. С релизом мою главную проблему при использования Canvas - то что там не работал code interpreter. Теперь ваши Python скриптики, над которыми вы работаете в Canvas, будут прекрасно запускаться прямо в чатгпт. Ещё добавили возможность использовать Canvas в Custom GPTs, вряд-ли это кому-то нужно, но пусть будет. А вот что интересно - ChatGPT может оставлять комменты к вашему коду/тексту видно на скриншоте . Вместе с релизом Canvas добавят и прямой способ использовать разные инструменты в диалоге, вроде генерации изображений или поиска. Случайных активаций генерации изображений или поиска станет поменьше когда SearchGPT запустили для всех меня они порядком выбесили .