ТЕХНО: Яндекс про технологии
150K subscribers
2.26K photos
536 videos
1 file
1.14K links
Канал о том, как устроен мир технологий. Разберёмся в потоке технологических новостей о нейросетях, роботах, голосовых помощниках, умном доме и не только. Чат канала https://yangx.top/+488-8LyZuSM1NWRi. : @technoyandex_bot
加入频道
📈🏆 У Яндекса больше зарегистрированных в РФ «цифровых» патентов, чем у любой другой технологической компании в России (по данным НИУ ВШЭ и АНО «Цифровая экономика»). Рассказываем, зачем их получать и как работает патентное право.

Что охраняется патентом?
Патентом охраняются три вида результатов интеллектуальной деятельности: изобретения, полезные модели и промышленные образцы.

Изобретение — это техническое решение в любой области: продукт (новое устройство или вещество) или способ (последовательность действий). В качестве изобретений часто патентуются софтверные решения — например, технологии поиска или управления беспилотным автомобилем.

Полезная модель — это техническое решение, относящееся к какому-либо устройству — например, Яндекс Станции.

Промышленный образец — это решение в области дизайна. Патент охраняет внешний вид изделия — например, интерфейс.

Разве авторского права недостаточно для защиты?
Нет. Авторское право распространяется только на форму разработки, а патент охраняет её суть. Например, авторское право защищает программный код как набор символов, но не защищает выполняемые им функции. А к техническим решениям во многих областях авторское право вообще не применимо, поэтому для защиты идеи нужен патент.

Почему тогда никто не запатентовал мессенджер или агрегатор такси?
Современные сервисы сложно запатентовать целиком: они состоят из множества решений, каждое из которых решает свою задачу. Поэтому IT-компании защищают не готовые продукты, а их составляющие: технологии, системы и методы, а также устройства, которые работают на их основе.

Что даёт наличие патента?
В первую очередь, охрану разработки: владелец может использовать её сам или выдать лицензию на использование другим компаниям. Также патент позволяет рассказывать об изобретении, не опасаясь плагиата.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
💡В Шедевруме появилась новая функция — теперь можно создавать не только картинки, но и тексты. Это стало возможным благодаря новой нейросети YaGPT, которая умеет генерировать тексты на основе заданных параметров.

Теперь пользователи Шедеврума могут создавать тексты для своих проектов, писать стихи, рассказы и статьи, используя новые возможности приложения.

Чтобы воспользоваться функцией создания текста, нужно выбрать соответствующий пункт меню и задать параметры текста: тему, стиль, длину и т.д. После этого нейросеть создаст текст на основе заданных параметров и пользователь сможет отредактировать его и использовать в своих целях.

Это отличное дополнение к уже имеющимся функциям Шедеврума, которое позволит создавать более разнообразные и качественные проекты.

Да, текст этого поста и обложку к нему мы полностью создали в Шедевруме с помощью нейросетей. Чтобы угадать со стилем и не ошибиться в фактах, промпт сформулировали так:

Шедеврум — приложение для генерации картинок, YaGPT — нейросеть для создания текстов. Напиши короткий пост о том, что в Шедевруме теперь можно генерировать не только картинку, но и текст


Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
🗣 Как добавить новый язык в SpeechKit — рассказываем на примере узбекского

Речевые технологии принято делить на распознавание речи и её синтез — то есть создание инструмента, который учится произносить всё, что угодно. Это — две принципиально разные задачи со своими сложностями.

Например, для обучения нейросети синтезу нужно минимум 30 часов качественной записи диктора в студии, а вот для распознавания лучше подойдут записи с шумами, кашлем и помехами.

Сегодня в сервисе распознавания и синтеза речи SpeechKit появился новый язык — узбекский. На примере него руководитель команды разработки эффективных ML-моделей Yandex Cloud Антон Ермилов в статье на Хабре рассказывает, как научить машину говорить и слушать на новом языке.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
📄🤖🖼 Чтобы Шедеврум или другая нейросеть сгенерировала картинку или текст, пользователю нужно составить для неё промпт. Разбираемся, что это такое и как его сформулировать (а также даём готовые примеры).

Промпт — это текстовый запрос, который пользователь отправляет нейросети. С помощью него нейросети генерируют контент, а если им не хватает параметров, они «додумывают» их сами (впрочем, не всегда так, как нужно пользователю). Поэтому формулировки очень важны: правильно составленный промпт может максимально приблизить полученный контент к желаемому. Вот три базовых шага:

1) Определите главное — то, что должно быть изображено на картинке или описано в тексте. Например, если речь о компьютерных играх, то для картинки запрос может звучать так: капибара играет в компьютер

А для текста — так: лучшие гранж-альбомы 2000-х годов

2) Придумайте детали. Чем подробнее промпт, тем лучше будет результат. Картинка получится точнее, если добавить описание места, действия или внешности: капибара в наушниках перед светящимся экраном в темноте

А в промпте для текста можно указать ключевые слова, последовательность повествования и другие подробности: короткая статья для бабушек о лучших гранж-альбомах 2000-х годов

3) Добавьте модификаторы — параметры, которые не имеют отношения к объекту, но влияют на результат. Например, стиль повествования, жанр текста и эмоциональный окрас: короткая статья для бабушек о лучших гранж-альбомах 2000-х годов, в жанре детектив, прилично

А в изображениях можно менять стиль, качество, реалистичность и даже освещение: капибара в наушниках перед светящимся экраном в темноте, в стиле Пикассо, высокое разрешение

Кстати, пользователям Шедеврума доступны подсказки по модификаторам — чтобы их посмотреть, нужно нажать на знак вопроса в правом верхнем углу экрана.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
This media is not supported in your browser
VIEW IN TELEGRAM
👨‍💻Чем запомнилась эта неделя

Первый в Европе законопроект о регулировании «искусственного интеллекта», проповедь от ChatGPT, примерка одежды с помощью нейросети от Google и другие новости, которые показались нам интересными.

Ставьте 🦄 (если считаете, что закон об «ИИ» нужен) и 🤔 (если считаете, что необходимости нет). Делитесь в комментариях своими находками, если мы что-то пропустили.

Европарламент предварительно одобрил законопроект о регулировании «искусственного интеллекта» (AI Act). Например, он обязывает помечать контент, созданный с помощью нейросетей. Окончательную версию закона ещё предстоит согласовать Еврокомиссии и странам-членам ЕС, а заработать он может не ранее 2025 года.

По трассе Москва – Санкт-Петербург поехали беспилотные грузовики. Их испытания начал «КамАЗ»: грузовики едут по трассе в автономном режиме, но в кабине сидит инженер, который следит за безопасностью. В рамках проекта «Беспилотные логистические коридоры» грузовики «КамАЗа» и других компаний будут перевозить коммерческие грузы.

В протестантской церкви в Германии состоялась ChatGPT-служба. Проповедь от лица четырёх аватаров организовал 29-летний теолог и философ Йонас Зиммерляйн из Венского университета. По его словам, 98% службы было создано нейросетью.

Нейросеть Google даёт примерить одежду. Компания внедрила нейросеть TryOn Diffusion в сервис Google Shopping. Пользователи могут увидеть, как будет выглядеть одежда на моделях с размерами от XXS до 4XL с учётом типа волос и оттенка кожи.

Что почитать на выходных: колонку британского писателя и разработчика Тристана Кросса о том, почему нейросети не смогут заменить людей, хотя Кремниевая долина и пытается убедить всех в обратном. Статья на английском — при необходимости переведите страницу в Яндекс Браузере.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
Forwarded from Яндекс
Первый двойной выпуск yet another podcast: говорим про роботакси и роботов-курьеров, которые доставляют еду. Но сначала поделимся парой фактов.

🚘 Про роботакси:
Автономные машины Яндекса ездят и в дождь, и в туман. На электронику роботакси они не влияют. Раньше сенсорам мешал густой дым из выхлопных труб, но позже разработчики справились с этой проблемой. Сейчас Яндекс останавливает роботакси только во время сильного снегопада.

🤖 Про роботов-курьеров: Когда в Яндексе начинали тестирование, за каждым роботом-курьером ходил специалист с кнопкой экстренной остановки. Таких людей неофициально называли ходителями. Сейчас это уже не требуется, но за роботами всё равно приглядывают операторы.

Ответы на всевозможные вопросы и про роботакси, и про роботов-курьеров ищите в большом выпуске — на YouTube и в Яндекс Музыке.
This media is not supported in your browser
VIEW IN TELEGRAM
☁️💻Сегодня Yandex Cloud открывает доступ к тестированию YandexGPT для бизнеса: компании смогут создать чат-ботов и умных помощников, генерировать контент и решать другие задачи — и всё это в облаке.

В новом выпуске ТЕХНО мы рассказываем, как устроены облачные сервисы. Целиком его можно прочитать здесь, а вот его некоторые материалы.

Рассказываем, как зарождалась и развивалась сама идея облачных вычислений

Почитайте, как обеспечивают безопасность облачных платформ: как устроено шифрование данных и их бэкап и почему компании могут доверять облачным сервисам

Если у вас сейчас нет настроения читать, сыграйте в игру. В облаках можно не только хранить данные, но и обучать алгоритмы. Например, нейросети, которые распознают и классифицируют изображения. В игре вы можете попробовать стать такой нейросетью и научиться отличать Моне от Мане, дирхаунда от волкодава, борщевик от дудника и многое другое.

И послушайте подкаст «Технорадио». В новом выпуске ведущая Адель Цебенко разбирается, как облачные технологии помогают науке. На вопросы отвечают Дмитрий Рыбалко, консультант по Data Science в Yandex Cloud, и Алексей Соловченко, профессор биологического факультета МГУ имени Ломоносова.
🙍| 🤖Отличить человеческую речь от синтезированной непросто, но вы можете попробовать. Пройдите этот тест и поделитесь в комментариях, сколько раз вы приняли алгоритм за человека.

🎤🔊 А вот что такое SpeechKit — единый инструмент для синтеза и распознавания речи на базе Yandex Cloud:

• SpeechKit — это технология, которую Яндекс начал развивать в 2013 году. Сегодня она используется во многих сервисах компании, и именно она подарила Алисе голос и умение слушать.

• До недавнего времени синтез речи был доступен на пяти языках — английском, иврите, казахском, немецком и русском, а на прошлой неделе добавился узбекский

• SpeechKit позволяет придать голосу максимальную схожесть с естественной речью. Можно расставить интонационные паузы или ударения в словах, которые одинаково пишутся, но произносятся по-разному (бе́лок и бело́к)

• Распознавание речи доступно на 16 языках — среди них русский, английский, немецкий, польский, турецкий, финский. SpeechKit также может распознавать речь в режиме полиглота — когда говорящий использует несколько языков

• Синтез речи делится на четыре основных этапа. Первые два предсказывают длительность и интонацию для каждой буквы в конкретном случае. Третий предсказывает акустические признаки, а четвёртый конвертирует результат в аудиодорожку

• SpeechKit активно используют сторонние компании, например Skyeng и Додо Пицца. А при помощи SpeechKit Brand Voice можно создавать собственные уникальные голоса. Такая речь может синтезироваться по шаблонам, а может учитывать разные переменные, такие как имена, номера карт и другое

• Использование синтеза и распознавания речи помогает бизнесу автоматизировать колл-центры, создавать голосовые интерфейсы и умных помощников. Помимо этого SpeechKit решает важную социальную проблему — позволяет озвучивать любой текст для слабовидящих людей

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
Продавцы Яндекс Маркета теперь могут создавать описания товаров с помощью YaGPT. Опция уже доступна на маркетплейсе — рассказываем, как это работает.

🪄 В личном кабинете продавца появилась кнопка, нажав на которую, можно получить текст за несколько секунд. Информацию для описания товара алгоритмы берут из его карточки — чем больше в ней данных, тем подробнее и точнее получится текст

🤖 За создание описания отвечает нейросеть YandexGPT. Чтобы она написала текст, достаточно нажать на кнопку «Создать с YaGPT». Текст появится через несколько секунд, после чего его можно проверить и отредактировать перед публикацией

📝 Информация о товаре проходит через промпт (текстовый запрос), который отвечает за сохранение структуры и достоверности описания товара. Например, промпт учитывает, что нужно использовать только описанные характеристики товара: это помогает ограничить фантазии нейросети

Алгоритмы проанализируют информацию в карточке товара и подберут наиболее подходящее описание: расскажут о преимуществах товара, перечислят способы его использования, объяснят, почему важен тот или иной параметр

🎓 В будущем промптов, на основе которых генерируется описание, станет больше. Под каждый товар будет автоматически подбираться промпт, который подробнее и лучше всего расскажет о товаре

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
🔎«Охота за ошибками» — постоянная программа Яндекса по поиску ошибок и уязвимостей. Любой пользователь может попробовать найти ошибки в сервисах и инфраструктуре компании, сообщить об этом и получить вознаграждение (а ещё попасть в Зал славы). Подробнее о программе можно узнать тут.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
🔎🪲 Программа по поиску ошибок и уязвимостей «Охота за ошибками» действует в Яндексе уже более 10 лет. Сейчас фонд программы решили увеличить в 2,5 раза — до 100 миллионов рублей. Рассказываем о самом феномене багбаунти.

Что такое багбаунти и зачем это компаниям?
Багбаунти (англ. «награда за баг») — это поиск уязвимостей в сервисах и инфраструктуре компаний за вознаграждение. Он решает ряд задач. Во-первых, это независимая проверка, к которой подключаются внешние специалисты. Во-вторых, это повышает защищённость сервисов и инфраструктуры.

Кто может участвовать?
Любой пользователь. Но награду получает тот, кто нашёл ошибку первым.

Какие есть ограничения?
• Искать нужно проблемы в безопасности. Ошибка в интерфейсе или в слове — в службу поддержки.
• Нельзя взламывать пользователей — только свои тестовые аккаунты.
• Детали уязвимости нельзя раскрывать какое-то время (в Яндексе — 90 дней). Это нужно, чтобы ошибку исправили, хотя часто это занимает значительно меньше времени.
• Сотрудники компании, объявившей о поиске ошибок, не могут в нём участвовать.
• Бывают ограничения по возрасту. В «Охоте за ошибками» Яндекса участвуют пользователи 14+, а те, кто младше 18 лет, делают это с письменного согласия родителей.

Что проверяют и что пытаются найти?
Охотники смотрят, как защищена серверная инфраструктура, нет ли проблем с аутентификацией и авторизацией, проверяют ограничения в промоакциях и многое другое (вот каталог типичных уязвимостей). Компания может выбрать конкретные продукты для проверки, а может предложить искать везде. В Яндексе «Охота за ошибками» охватывает все сервисы и приложения, а также умные устройства.

Много людей участвуют?
Можно судить по результатам «Охоты за ошибками» в Яндексе за 2022 год: 414 исследователей прислали 905 отчётов, из них 288 были уникальными. За найденные ошибки Яндекс заплатил в сумме около 40 миллионов рублей.

Можно научиться этому?
Да. Например, записавшись в Школу информационной безопасности.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex
ТЕХНО: Яндекс про технологии
👨‍💻Чем запомнилась эта неделя Камера с нейросетями, но без объектива, наказание за использование ChatGPT и другие новости мира технологий, которые показались нам интересными. Нью-йоркскому адвокату грозит наказание за использования ChatGPT. Защищая своего…
⚖️ Дело американского адвоката Стивена Шварца, использовавшего ChatGPT для защиты своего подсудимого, завершилось. Суд назначил Шварцу и его партнёру Питеру ЛоДуку штраф в 5000 долларов. Подсудимый заявил, что посчитал ChatGPT продвинутым поисковиком и не знал, что он может выдумывать факты.

О том, почему стоит внимательно относиться к тому, что языковые модели выдают за факты, мы подробнее рассказывали в этом материале.
👨‍🏫🤖👩‍🏫Чтобы ответы нейросети были адекватными, полезными и максимально похожими на человеческие, её нужно обучать при помощи людей — AI-тренеров. В первую очередь, AI-тренер должен уметь работать с текстами, поэтому на эту должность часто приходят копирайтеры, редакторы, контент-менеджеры и лингвисты. Рассказываем, как такие люди помогают нейросетям становиться лучше.

• Пишут эталонные ответы на запросы
Идеальный ответ должен быть грамотным и структурированным, соответствовать нормам этики и чётко отвечать на запрос пользователя. Чем больше таких ответов показать нейросети, тем точнее будут её собственные. На начальном этапе любая модель обучается на текстах из интернета, но в качестве эталонных они не подходят, так как часто бывают низкого качества, могут содержать неверную информацию и иметь запутанную структуру. Поэтому AI-тренеры готовят часть ответов на разные вопросы, чтобы показать нейросети эталонные примеры и помочь ей составлять свои ответы по тому же принципу.

• Проверяют тексты, написанные нейросетью, на соответствие фактам
Языковые модели могут очень убедительно врать — этот феномен называется галлюцинациями нейросетей. Это происходит не потому, что кто-то хочет ввести пользователей в заблуждение. Языковые модели не могут осмыслить информацию и не способны делать самостоятельные выводы, они просто собирают ответы из наиболее подходящих слов. Одна из задач AI-тренера — проверить факты и показать модели, где правда, а где ложь.

• Оценивают и ранжируют ответы нейросетей
Модель генерирует несколько ответов на один и тот же запрос, а тренер даёт ей обратную связь. Он показывает, какие элементы ответа следует использовать в дальнейшем, а какие — нет. Так нейросеть может «понять», в каком направлении развиваться. Этот метод обучения называется RLHF (reinforcement learning with human feedback), что означает обучение с подкреплением на основе отзывов людей.

Подписывайтесь 👉@techno_yandex

Не пропускайте новости Яндекса тут @yandex
This media is not supported in your browser
VIEW IN TELEGRAM
👨‍💻Технодайджест недели

YandexGPT для бизнеса, запрет «Грэмми» на сгенерированные песни и другие новости, которые показались нам интересными. Ставьте 🦄, если считаете, что музыка, созданная нейросетями достойна музыкальных премий, и 😐 — если нет.

Сгенерированные нейросетями песни не получат премию «Грэмми». Организаторы объяснили, что использовать нейросети в творчестве можно, но необходимо, чтобы в произведении был существенный вклад человека.

У YandexGPT появился API – компании смогут встраивать нейросеть в свои сервисы. Например, с её помощью можно генерировать описание товаров или создать чат-бота для общения с клиентами. Пока инструмент доступен в тестовом режиме – для его использования необходимо оставить заявку на сайте Yandex Cloud.

Google запретила сотрудникам использовать код, написанный чат-ботом Bard (его разработала сама Google). Компания объяснила это тем, что Bard может генерировать «нежелательный» код. Сотрудники могут пользоваться Bard, но не напрямую копируя сгенерированный код, а используя его как подсказки.

Видеохостинг Vimeo разработал нейросетевой редактор видео. Он умеет генерировать сценарий по короткому описанию с помощью API OpenAI и позволяет автоматически вырезать из роликов «эээ», «ммм» и другие слова-паразиты, а также долгие паузы.

Вышли новые версии нейросетей Midjourney и Stable Diffusion. Качество обеих моделей возросло, а в Midjourney появились ещё и новые функции, например, функция дорисовки изображения по бокам, как в недавнем обновлении Photoshop, и возможность оптимизировать промпт, убрав из него бесполезные слова.

Что почитать на выходных: подборку IEEE Spectrum с мнениями 22 ведущих экспертов – от главы OpenAI Cэма Альтмана до лауреатов премии Тьюринга – о сильном искусственном интеллекте (AGI) и будущем человечества.

А также рассказ The Wall Street Journal о том, как знаменитости используют свои генеративные двойники для рекламы. Оба материала на английском — при необходимости переведите страницу в Яндекс Браузере.

Подписывайтесь 👉@techno_yandex
🤖📝 Разработчики Яндекса научили языковую модель YandexGPT кратко пересказывать русскоязычные тексты длиной до 30 тысяч знаков. Например, аналитические обзоры, статьи или новости. Нейросеть умеет выделять в текстах главное и составлять их краткое резюме в виде тезисов. Чтобы получить пересказ материала, нужно отправить нейросети ссылку. Бета-версия технологии уже доступна на сервисе 300.ya.ru

Зачем это нужно?
В первую очередь, чтобы сэкономить время пользователей. Благодаря YandexGPT можно за минуту узнать содержание материала, на чтение которого раньше потребовалось бы 15–20 минут.

Краткий пересказ позволит:
— быстро найти ответ на вопрос, не читая текст целиком;
— понять, стоит ли читать полный текст статьи;
— делиться ссылками на интересные материалы, дополняя их кратким изложением.

Почему это сложная задача для нейросетей?
Нейросети нужно найти самые важные тезисы — для этого требуется практически человеческое понимание материала. Чтобы добиться этого, сначала ей показали множество книг и текстов из интернета, а потом дообучили на основе пересказов, написанных асессорами и AI-тренерами.

Подписывайтесь 👉@techno_yandex

Не пропускайте новости Яндекса тут @yandex
☁️💻Облака — это не только хранение данных на виртуальном диске. Сегодня почти всё в интернете работает с участием облачных технологий — начиная с крупнейших онлайн-кинотеатров и заканчивая сервисами знакомств. Рассказываем, как появились и развивались облачные технологии, — листайте карточки. А подробнее об этом читайте в новом выпуске ТЕХНО.

Подписывайтесь 👉 @techno_yandex

Не пропускайте новости Яндекса тут @yandex