Ivan Begtin
22.07.2025 15:00
Оказывается Яндекс сертифицировался по ISO/IEC 42001:2023 до этого это сделали не так уж много компаний. Amazon AWS в декабре 2024, Microsoft несколько дней назад, Thompson Reuters в марте 2025, Anthropic в январе 2025. В любом случае их немного. Что важно, нельзя получить сертификат используя чужую облачную LLM, это сертификат на управление ИИ, рисками и тд. Сертификация по этому стандарту, в любом случае, никого не спасёт от регулирования, но некую планку этической разработки ИИ задаёт. #ai
Ivan Begtin
22.07.2025 15:00
Наряду с быстрым развитием ИИ возникают вопросы о его безопасности. Чтобы уменьшить возможные риски, ведущие российские компании, работающие с ИИ, следуют Кодексу этики — принципам для всех, кто связан с созданием, развитием и применением ИИ в России. Теперь же Яндекс первым в России получил международный сертификат ISO/IEC 42001. Это означает, что компания соблюдает высокие стандарты безопасности и этики при разработке YandexGPT. Для пользователей это дополнительная гарантия надежности. Для рынка — сигнал, что российские технологии соответствуют мировым требованиям. Важный шаг в развитии генеративных нейросетей в стране и хороший пример для всей отрасли. Такое ответственное саморегулирование — ключевое качество для компаний, стремящихся стать лидерами в ИИ.
Ivan Begtin
15.07.2025 07:25
Портал открытых данных все-таки запустили, но без «финансов» Очень много вопросов к структуре и качеству реализации. Начнем с финансов: - финансы, к сожалению, отдельной категории не удостоились; - у Минфина России на портале 0 датасетов что, конечно, говорит об отсутствии интеграции Портала открытых данных с внешними системами ; - Федеральному казначейству повезло чуть больше: у них аж 9 датасетов, обновленных в 2014 году 11,5 лет назад ; - Счетной палате РФ повезло еще меньше, чем Минфину России - их даже как организации нет. Напомню, что курирует Портал ОД Минэк, который как поставщик разместил на портале 31 набор данных, 5 из которых были обновлены в 2021 году, 1 - в 2019, 6 - в 1970. Не густо пока. Можно было бы предположить, что Минэк публикует свои данные на сайте Министерства, но тоже нет - там всего три датасета, правда от 2024 и 2025 годов. То есть интеграции с Порталом открытых данных нет даже у курирующего его министерства. Напоминаю ссылку на портал: data.gov.ru
Ivan Begtin
26.06.2025 14:30
Вышла 3-я редакция стандарта формата для изображений PNG [1]. Почему это событие? Потому что предыдущая, вторая редакция [2], выходила в 2003 году 22 года назад! Что нового: - признание анимированных PNG APNG - правильная поддержка HDR - официальная поддержка данных Exif А также многое другое, но каких то особенных действий предпринимать не нужно поскольку большая часть популярных инструментов и так поддерживали эти расширения PNG и без принятого стандарта. Ссылки: [1] [2] #standards
Ivan Begtin
20.06.2025 14:45
MIT: ChatGPT может разучить тебя думать Новое исследование MIT показало: если писать с помощью AI, мозг начинает халтурить. У студентов, которые писали эссе с ChatGPT, слабее работали участки мозга, отвечающие за внимание и память. Они хуже запоминали, что сами же только что написали, и выдавали более шаблонные тексты. Учёные называют это «когнитивным долгом»: ты передаёшь мышление модели, а сам просто жмешь кнопки. Эффект остаётся даже после отключения AI. Те, кто долго писал с чат-ботом, потом хуже справлялись без него. А вот если сначала думал сам, а потом подключал ChatGPT — мозг наоборот работал лучше. Отчет ученых из MIT можно почитать тут:
Ivan Begtin
04.04.2025 05:26
Яндекс запустил AI помощника Нейроэксперт [1] который умеет анализировать документы и отвечать на простые вопросы по ним. Не первый, не последний такой инструмент. Мне вот тоже такой нужен, но желательно в виде API и которому можно скармливать базы данных, а не только файлы. Инструмент любопытный для всех кто анализирует документы на русском языке. Но один тест он не проходит. Несмотря на все попытки этот AI помощник не хочет становится котом. Мда. Всё таки Яндекс слишком сильно цензурирует ИИ Для сравнения диалог с ChatGPT Ссылки: [1] #ai #aitools #cats
Ivan Begtin
03.04.2025 12:36
Билл Гейтс опубликовал оригинальный код Microsoft 50 летней давности, для Altair BASIC [1]. Подумать только, я вот BASIC во всех формах застал очень мало. Только QBasic в ранних версиях MS DOS и совсем немного Visual Basic в Windows. А так мой самый ранний код - это Паскаль и Ассемблер. И, признаться, в 15-16 лет я писал его чище и аккуратнее, но с куда меньшим пониманием ответов на вопрос "зачем". Но код на BASIC это, в любом случае, ностальгия. Ссылки: [1] #opensource #microsoft #billgates #digitalpreservation
Ivan Begtin
03.04.2025 08:56
Новые тарифы введённые Трампом в США сейчас наделали много шума. У США большой торговый дефицит, особенно с ЕС и Китаем, но... есть нюанс. Этот дефицит почти весь в физических товарах, а в цифровых продуктах и сервисах у США невероятный профицит. Для тех кто не читал ещё, статья в Nature от июня 2024 года Estimating digital product trade through corporate revenue data [1] где авторы декомпозировали импорт/экспорт стран на основе отчётов цифрового крупняка. Там есть что почитать. А один из авторов той работы, Цезарь Идальго, опубликовал вот такие картинки по структуре импорта и экспорта цифровых продуктов [2]. Почему это важно? Потому что один из вероятных сценариев ответа на тарифы Трампа может быть "тарифный удар" по цифровым продуктам и сервисам из США, тоже для соблюдения паритета торгового баланса. А это затронет практически весь ИТ сектор по всему миру. Ссылки: [1] [2] #thoughts #tariffs #it #usa #trump
Ivan Begtin
19.03.2025 08:30
Национальный архив США начал публиковать материалы рассекречивания дела по убийству Президента Кеннеди [1]. Материалы эти в виде сканов и оцифрованных аналоговых аудиозаписей, уже опубликовано 61400 страниц, это более чем 2000 PDF документов и это только за 18 марта. Ждём пополнения коллекции. Ссылки: [1] #digitalpreservation #archives #usa #kennedy
Ivan Begtin
14.02.2025 15:47
Каемся: совсем пропустили новость, что в России планируют открыть доступ к размеченным и обезличенным госданным для бизнеса, госорганов и физлиц. Их предлагают использовать для обучения и тестирования ИИ-алгоритмов. Первые контракты на получение размеченных материалов участники инициативы смогут заключить уже в феврале. Проходить всё это будет на безвозмездной основе, рассказал Ведомостям представитель аппарата вице-премьера Дмитрия Григоренко. Первые 10 наборов с размеченными данными были сформированы еще в 2023 году, остальные 40 — в конце ноября 2024 года. В основном это «фото и видеоматериалы, пригодные для машинного обучения и решения задач в таких отраслях, как городская среда и ЖКХ, транспорт, экология, сельскохозяйственная деятельность». Оператором передачи данных выступает Минцифры. В соглашениях, разработанных согласно утверждённому Григоренко плану, обозначены задачи, сроки передачи, период, в течение которого получающая сторона может использовать эту информацию, а также гарантии целевого использования и защиты от их распространения третьим лицам. Первые запросы на использование государственных наборов данных уже направили правительства Тюменской и Липецкой областей. В первой планируют применить материалы в области управления городским хозяйством и развития интеллектуальных транспортных систем. Во второй — для «распознавания изображений», но каких, не уточняется. Вообще, сам запуск такой инициативы выглядит интересно. В отдельных кейсах применение госданным явно найдётся: например, в 2024 году была выполнена разметка материалов на основе съёмки с БПЛА и из космоса для определения категорий ТС, древесного состава и состояния лесов, а также сельхозугодий.