24 октября, 15:17

Google запускает SynthID Text для маркировки текстов, созданных ИИ

Google представила технологию SynthID Text, которая позволяет добавлять водяные знаки и распознавать текст, созданный ИИ  Google открыла доступ к технологии SynthID Text, которая позволяет добавлять водяные знаки в текст, сгенерированный ИИ, и распознавать его.   Инструмент доступен для скачивания на платформе Hugging Face, а также через обновлённый Responsible GenAI Toolkit.  1   DevHub Community
DevHub Community
DevHub Community
Google представила технологию SynthID Text, которая позволяет добавлять водяные знаки и распознавать текст, созданный ИИ Google открыла доступ к технологии SynthID Text, которая позволяет добавлять водяные знаки в текст, сгенерированный ИИ, и распознавать его. Инструмент доступен для скачивания на платформе Hugging Face, а также через обновлённый Responsible GenAI Toolkit. 1 DevHub Community
Google представила новую технологию для маркировки и распознавания текстов, созданных генеративными ИИ-моделями. Инструмент SynthID Text не повлияет на скорость и качество генерации контента и будет предоставлен бесплатно разработчикам и компаниям.
Хайтек
Хайтек
Google представила новую технологию для маркировки и распознавания текстов, созданных генеративными ИИ-моделями. Инструмент SynthID Text не повлияет на скорость и качество генерации контента и будет предоставлен бесплатно разработчикам и компаниям.
Сфера Блогинга
Сфера Блогинга
Google открыл доступ к SynthID Text — это технология для водяных знаков в тексте, сгенерированного AI. Наличие водяного знака позволяет надежно определить, что текст сгенерирован AI, но есть одна загвоздка — как правило, внедрение обязательных элементов в тексте плохо влияет на качество этого текста. Кстати, мы же это много раз видели до засилья AI, языковые модели, скачать бесплатно, без смс и регистрации. Модель хорошо справляется с большими текстами, немного хуже с короткими и фактическими ответами, а также переводами. Подобная технология в работе также у OpenAI. Тем более, что в Китае такая маркировка обязательна.
Google Deepmind опенсорснули SynthID – инструмент для встраивания и обнаружения водяных знаков в сгенерированном тексте   Идентификация сгенерированного текста вообще больная тема. Классификаторы работают очень плохо, а альтернативных решений мало: разве что вотермарки. Но существующие решения для водяных знаков либо очень тормозят инференс, либо откровенно портят текст, либо на этапе обнаружения скатываются в точность классификаторов. SynthID – попытка это исправить.   Исследователи предлагают встаивать вотермарки дешево, внося несущественные изменения в процедуру выбора следующего токена на этапе, когда вероятности уже посчитаны. Таким образом мы влияем на распределение конечного текста и как бы вносим статистическую "подпись" в генерации  скрин 1, 2 . На этапе идентификации можно просто посчитать статистики и по трешхолдам определить, сгенерирован текст или нет.   Гиперпараметры метода можно настраивать: мы можем вносить больше изменений, тогда текст будет меняться сильнее и перформанс может немного падать, но обнаружить вотермарку будет проще. Или наоборот, можем выкрутить температуру, и вотермарки станут более прозрачными  скрин 3 .   Самое интересное: Google даже попробовали катнуть неискажающий вариант SynthID в продакшн gemini и доказали, что пользователи в основном не замечают изменений, а вотермарки, тем не менее, можно обнаружить с приемлемой точностью.   Статья в nature   Релиз на HF
Data Secrets
Data Secrets
Google Deepmind опенсорснули SynthID – инструмент для встраивания и обнаружения водяных знаков в сгенерированном тексте Идентификация сгенерированного текста вообще больная тема. Классификаторы работают очень плохо, а альтернативных решений мало: разве что вотермарки. Но существующие решения для водяных знаков либо очень тормозят инференс, либо откровенно портят текст, либо на этапе обнаружения скатываются в точность классификаторов. SynthID – попытка это исправить. Исследователи предлагают встаивать вотермарки дешево, внося несущественные изменения в процедуру выбора следующего токена на этапе, когда вероятности уже посчитаны. Таким образом мы влияем на распределение конечного текста и как бы вносим статистическую "подпись" в генерации скрин 1, 2 . На этапе идентификации можно просто посчитать статистики и по трешхолдам определить, сгенерирован текст или нет. Гиперпараметры метода можно настраивать: мы можем вносить больше изменений, тогда текст будет меняться сильнее и перформанс может немного падать, но обнаружить вотермарку будет проще. Или наоборот, можем выкрутить температуру, и вотермарки станут более прозрачными скрин 3 . Самое интересное: Google даже попробовали катнуть неискажающий вариант SynthID в продакшн gemini и доказали, что пользователи в основном не замечают изменений, а вотермарки, тем не менее, можно обнаружить с приемлемой точностью. Статья в nature Релиз на HF
Нейронавт | Нейросети в творчестве
Нейронавт | Нейросети в творчестве
SynthID Text DeepMind и Hugging Face выпустили SynthID для создания водяных знаков на текстах, сгенерированных LLM SynthID Text, согласно статье, служит не для обнаружения любого сгенерированного LLM текста, а для маркировки какой именно LLM он сгенерирован. Видимо, им важно найти виноватого в случае чего Инструмент кодирует водяной знак в текст, не изменяя работу базового LLM и не снижая качество генерируемого текста. При этом использование SynthID не требует переподготовки основного LLM. Но для каждой конфигурации водяных знаков потребуется обучить модель классификатора. По словам исследователей, SynthID Text устойчив к некоторым преобразованиям после генерации, таким как обрезка фрагментов текста или изменение нескольких слов в сгенерированном тексте. Он также в некоторой степени устойчив к перефразированию. Однако у этого метода есть несколько ограничений. Например, он менее эффективен при работе с запросами, требующими фактических ответов, и не позволяет вносить изменения без снижения точности. Также они предупреждают, что качество детектора водяных знаков может значительно снизиться при тщательном переписывании текста. SynthID не предназначен для остановки вредоносных действий, но может затруднить использование контента, созданного ИИ, в вредоносных целях. Код/Демо #news #watermark
Loading indicator gif
О проверках "дроповодов" и криптообменников и не только - на tokengram.ru
Tokengram.ru
Tokengram.ru
О проверках "дроповодов" и криптообменников и не только - на tokengram.ru
Google представила технологию для маркировки и распознавания текстов, созданных генеративными моделями ИИ. Инструмент под названием SynthID Text не повлияет на качество и скорость генерации контента, и будет доступен совершенно бесплатно для разработчиков и компаний.  SynthID Text работает следующим образом. При генерации текста модель предсказывает, какой «токен» будет следующим, основываясь на вероятности появления каждого токена, и добавляет дополнительную информацию в распределение этих вероятностей, модулируя скорректированные символы. В конечном итоге из них формируется водяной знак, который помогает определить, был ли текст создан ИИ. «Окончательный паттерн вероятностей слов, выбранных моделью, в сочетании с изменёнными оценками вероятностей будет считаться водяным знаком», — объясняется в блоге компании.
был бы ты человек - IT, digital
был бы ты человек - IT, digital
Google представила технологию для маркировки и распознавания текстов, созданных генеративными моделями ИИ. Инструмент под названием SynthID Text не повлияет на качество и скорость генерации контента, и будет доступен совершенно бесплатно для разработчиков и компаний. SynthID Text работает следующим образом. При генерации текста модель предсказывает, какой «токен» будет следующим, основываясь на вероятности появления каждого токена, и добавляет дополнительную информацию в распределение этих вероятностей, модулируя скорректированные символы. В конечном итоге из них формируется водяной знак, который помогает определить, был ли текст создан ИИ. «Окончательный паттерн вероятностей слов, выбранных моделью, в сочетании с изменёнными оценками вероятностей будет считаться водяным знаком», — объясняется в блоге компании.
БлоGнот
БлоGнот
Google открыл доступ к SynthID Text — это технология для водяных знаков в тексте, сгенерированного AI. Наличие водяного знака позволяет надежно определить, что текст сгенерирован AI, но есть одна загвоздка — как правило, внедрение обязательных элементов в тексте плохо влияет на качество этого текста. Кстати, мы же это много раз видели до засилья AI, языковые модели, скачать бесплатно, без смс и регистрации. Модель хорошо справляется с большими текстами, немного хуже с короткими и фактическими ответами, а также переводами. Подобная технология в работе также у OpenAI. Тем более, что в Китае такая маркировка обязательна.
RevВолны
RevВолны
Google представила технологию SynthID Text, которая позволяет добавлять водяные знаки и распознавать текст, созданный ИИ Доступный на платформе Responsible GenAI Toolkit, инструмент имеет открытый исходный код для разработчиков. Технология работает путем изменения распределения вероятностей токенов в предсказаниях ИИ, что позволяет отличать сгенерированный текст от обычного. Хотя SynthID Text не ухудшает качество генерации и справляется с модифицированными текстами, она менее эффективна с короткими текстами и фиксированными вопросами. Компании, такие как OpenAI, также разрабатывают аналогичные методы, но стандарты их применения ещё не определены. ================
Google представила инструмент для распознавания текстов, созданных ИИ, который стал доступен всем желающим  Компания выпустила технологию SynthID Text, позволяющую внедрять водяные знаки в тексты, сгенерированные искусственным интеллектом, и обнаруживать их.  Этот инструмент доступен для скачивания на платформе Hugging Face и в обновлённом Responsible GenAI Toolkit.    Кроме того, Google поделилась исходным кодом SynthID Text с разработчиками и компаниями, что должно упростить процесс идентификации контента, созданного ИИ.     При генерации текста ИИ-модель корректирует вероятности появления определённых токенов, благодаря чему в текст встраивается своеобразный «водяной знак».   Эти изменения сохраняются, и их можно использовать в будущем для определения, был ли текст сгенерирован при помощи ИИ.  Google уверяет, что её технология, встроенная в модели Gemini, не влияет на качество и скорость генерации текста.
Хлебни ИИ - про искусственный интеллект
Хлебни ИИ - про искусственный интеллект
Google представила инструмент для распознавания текстов, созданных ИИ, который стал доступен всем желающим Компания выпустила технологию SynthID Text, позволяющую внедрять водяные знаки в тексты, сгенерированные искусственным интеллектом, и обнаруживать их. Этот инструмент доступен для скачивания на платформе Hugging Face и в обновлённом Responsible GenAI Toolkit. Кроме того, Google поделилась исходным кодом SynthID Text с разработчиками и компаниями, что должно упростить процесс идентификации контента, созданного ИИ. При генерации текста ИИ-модель корректирует вероятности появления определённых токенов, благодаря чему в текст встраивается своеобразный «водяной знак». Эти изменения сохраняются, и их можно использовать в будущем для определения, был ли текст сгенерирован при помощи ИИ. Google уверяет, что её технология, встроенная в модели Gemini, не влияет на качество и скорость генерации текста.
Google выпускает инструмент для обнаружения текста, созданного ИИ    На днях Google DeepMind представила открытый инструмент для выявления текста, созданного искусственным интеллектом. Новый метод водяных знаков, уже использующийся для сообщений чат-бота Gemini, теперь доступен всем разработчикам AI. Эта технология позволяет легко отличить AI-контент от написанного человеком, что может стать важным шагом в борьбе с дезинформацией и академическим мошенничеством.  Инструмент SynthID добавляет уникальную статистическую подпись в текст, делая его распознаваемым специальными программами. С этой технологией Google надеется повысить прозрачность AI-контента и снизить риски злоупотреблений, предлагая разработчикам новый уровень защиты.
AI Masterminds
AI Masterminds
Google выпускает инструмент для обнаружения текста, созданного ИИ На днях Google DeepMind представила открытый инструмент для выявления текста, созданного искусственным интеллектом. Новый метод водяных знаков, уже использующийся для сообщений чат-бота Gemini, теперь доступен всем разработчикам AI. Эта технология позволяет легко отличить AI-контент от написанного человеком, что может стать важным шагом в борьбе с дезинформацией и академическим мошенничеством. Инструмент SynthID добавляет уникальную статистическую подпись в текст, делая его распознаваемым специальными программами. С этой технологией Google надеется повысить прозрачность AI-контента и снизить риски злоупотреблений, предлагая разработчикам новый уровень защиты.
Loading indicator gif