Поиск смыслов. В гостях у Яндекс Переводчика

Vladimir Merkushev
8 min readJul 12, 2021

--

Сходить в гости в офис большой компании в условиях пандемии — не простая задача. Многие из них ограничили доступ гостей в свои офисы либо ввели дополнительные требования для визита, например, справку с негативным тестом на COVID. Но я не собираюсь прерывать свой цикл ПокаВсеВОфисе! В этот раз у меня получилось пообщаться с ребятами из команды Яндекс.Переводчика — продукта, который помогает миллионам клиентов стирать языковые барьеры и неплохо монетизируется за счёт B2B направления. Хотите узнать, как в Яндексе решили заняться переводом и как работают команды, главный продукт которых — модели машинного обучения? Читайте дальше!

Переводчик родился в Яндексе как пет-проект одного из разработчиков. Ведь поиск перевода — это тоже поиск. И если использовать умение хорошо искать тексты с пониманием их смысла, то может получиться полезный продукт для всех, кому нужен перевод с иностранного языка, — такой была гипотеза на старте. Запустили продукт в 2011 году на базе команды, которая занималась поисковыми подсказками и исправлением опечаток в поисковых запросах. В те времена поиск ещё не был семантическим и качество выдачи сильно зависело от грамотности заданного запроса. Поэтому в команде “опечаточника” были лучшие специалисты, достаточно ресурсов и крутые технологии работы с текстом.

У меня получилось пообщаться с Еленой Чернышевой, продакт менеджером и Антоном Дворковичем, техлидом департамента машинного интеллекта и исследований. В департаменте работает около 80 человек. Большая часть ребят это датасайнтисты и аналитики, которые занимаются развитием технологий машинного перевода, распознавания голоса, синтеза речи в Алисе и так далее. Раз в полгода ребята формулируют для себя цели и проекты и собирают команды вокруг них. Основной акцент команды делают на развитие технологий, поэтому нередко в роли продакта, который отвечает за цель, выступает аналитик или разработчик. Для того, чтобы понимать, в какую сторону развивать технологии, команды делают совместные запуски с другими сервисами Яндекса и регулярно общаются с клиентами Я.Облака, именно через него можно получить доступ к API Переводчика. И еще внутри департамента есть несколько продуктов, которые также помогают лучше понять потребности рынка и пользователей: Яндекс.Переводчик, Клавиатура, Опечаточник и другие.

В основном мы говорили о Яндекс.Переводчике и особенностях управления продуктом, полностью построенном на технологиях машинного обучения. За него отвечает Лена. В продукте есть два направления: B2C и B2B. В B2C части команда Лены фокусируется на росте аудитории и частоты использования Переводчика. Также здесь есть свои особенности, которые влияют на выбор метрик:

  • Нет однозначного сигнала о том, что пользователь решил свою задачу. Пользователь не совершает покупку, не делает звонок и тд. Он получает перевод, а дальше по косвенным признакам нужно понять, насколько успешной была сессия и/или полезным перевод. Можно измерять NPS, что ребята и делают, но для того, чтобы лучше понимать, насколько успешно продукт решает задачу пользователя, также разрабатывают и свои внутренние метрики.
  • Большая и разнородная аудитория. Часть пользователей использует переводчик практически каждый день для работы и для учебы, часть — время от времени для решения бытовых задач (перевести этикетку на товаре, письмо от китайского продавца и тд). Помимо этого, очень различаются сценарии использования продукта в зависимости от уровня знания языка пользователя и используемых языковых пар. Поэтому перед аналитиками стоит непростая задача понять, к какому сегменту относится пользователь, а перед продактом — определить, какие сегменты наиболее важны.
  • Перевод — это давно уже не только перевод текста. Люди все чаще получают информацию совсем другими способами. Команда Переводчика стремится сделать так, чтобы пользователь мог быстро понять смысл вне зависимости от того, каким образом он получил информацию. Продукт умеет переводить документы, фотографии, сайты, аудио. Для каждой такой вертикали используется свой набор технологий и метрик.

Из последнего пункта вытекает самое большое отличие в работе продакт-менеджера, который развивает продукты, построенные на базе ML-технологий. В таких продуктах очень важно качество технологий. Если Переводчик будет отдавать перевод плохого качества, то пользователи не будут им пользоваться. Продукт не спасет идеальный UX и дополнительная функциональность. Продакт менеджер должен уметь ответить на вопрос “Что такое хороший перевод?” и иметь представление, как это можно оценить.

Другой пример — фотоперевод. Для того, чтобы он заработал, необходимо использовать целую серию разных алгоритмов: для распознавания текста, для определения языка текста, перевода, рендеринга текста и так далее. Каждый из этих алгоритмов имеет свою точность и полноту, качество каждого алгоритма влияет на качество другого. Если на этапе распознавания текст получили с ошибками, то и хороший перевод будет сделать невозможно. В таких случаях приходится придумывать метрики качества, которые бы отражали тот факт, что продукт решает задачу пользователя, и далее разбить ее на подметрики, чтобы понимать качество на каждом шаге.

Для B2C-направления на российском рынке основной конкурент Переводчика — это Google Translate и бумажный словарь. Да, бумажные словари всё ещё советуют преподаватели в школах! Google Translate ребята воспринимают как полезного конкурента, соревнование с которым помогает сделать качество продукта лучше. Делают регулярные сверки по качеству, смотрят долю рынка. Сейчас он поделен примерно 50 на 50. Особенно сложно было вначале, когда пользователи воспринимали продукт от Google как единственный доступный онлайн-сервис машинного перевода. Здесь ребятам пришлось догонять, ведь Google Translate запустили в 2006 году. Росту аудитории в основном способствуют качество перевода и экосистема Яндекса — интеграции с другими продуктами. Сейчас сайтом и приложением Яндекс.Переводчика пользуются десятки миллионов человек в месяц.

У Яндекс.Переводчика есть и второе большое направление — это B2B продукты. Рынок машинного перевода и необходимость в нем растет, так как растет общее количество производимого контента в мире, в основном за счет UGC. Всё большее количество компаний стремятся выйти на новые рынки. Появляется много новых сегментов, в которых необходим машинный перевод. К примеру, не так давно появился новый сегмент компаний, которые помогают мониторить появление отзывов или новостей. Часто клиентами таких компаний являются международные компании, которые хотят понимать, что пишут о них их пользователи из разных стран.

Кстати, для меня стало сюрпризом, что большинство B2B клиентов у Переводчика не из России. Видимо, сработал шаблон, что Яндекс лучше всех умеет работать с русским языком и многим компаниям интересен рынок России. Оказалось, что Яндекс.Переводчик поддерживает более 90 языков и клиенты часто используют B2B продукт для работы на рынках Китая, Японии и других стран.

В B2B у Переводчика другие конкуренты. Это не только Google. Свои решения делают многие крупные компании такие, как Alibaba, Baidu, Amazon, Microsoft, DeepL и другие игроки. Рынок машинного перевода быстро растет, появляется много новых игроков, так как разработка технологий становится все доступнее, но нет еще явных лидеров и есть большое количество ниш.

“Мы хотим стереть языковые барьеры”

Так звучит миссия команды. И это далеко не только про удобный интерфейс и качество перевода. Команде Переводчика важно, чтобы пользователю не нужно было делать лишних действий для понимания информации на другом языке. Поэтому необходимо, чтобы перевод был доступен сразу в том месте, где пользователь потребляет контент. Для этого Переводчик развивает B2B направление, API которого, могут использовать другие разработчики. Замечание из моего собственного опыта — было бы круто иметь встроенный в Slack перевод, ведь копипастить каждую фразу, чтобы понимать что пишут коллеги из разных офисов, когда им не хочется или “не можется” использовать официальный в OLX Group английский, не очень удобно!

Яндекс.Переводчик для бизнеса

Сейчас машинный перевод также активно используют сами переводчики. Мало кто переводит текст от и до. В программных средах для работы над текстами (cat-программах) встроен сервис машинного перевода, например от Яндекса, который формирует первую версию документа. Уровень качества машинного перевода уже часто не уступает обычным людям, знающим иностранный язык. Поэтому профессиональному переводчику-человеку достаточно его только отредактировать.

К сожалению, в сам офис, где сидит команда Яндекс.Переводчика, попасть не получилось. Посещение гостями большого и красивого кампуса Яндекса сейчас закрыто. Пускают только сотрудников, у которых наличие отрицательного COVID теста или прививки привязано к пропуску. Так что фотографии из офиса, которые вы видите в посте, сделаны самими сотрудниками. Также вы можете посмотреть мой давний пост, где описан процесс онбординга новых яндексоидов глазами новичка. Там много фото из всех уголков офиса Яндекса на улице Льва Толстого.

Но Музей Яндекса оказался открытым! Мы заглянули туда вместе с Леной и я сделал много интересных фото, а также прикупил себе и своим близким несколько сувениров. Отличное место! Будете в районе Парка Культуры в Москве, обязательно загляните.

Блиц с Леной Чернышевой, менеджером продукта в Яндекс

Назови 3 сайта или приложения, которыми ты часто пользуешься?

У меня есть любимые сервисы, а не сайты или приложения. Для меня сайт или мобильное приложение — это только инструменты, которые помогают либо с привлечением пользователей, либо помогают улучшить опыт использования продукта.

Из любимых сервисов:
- Госуслуги и сервисы от налоговой
- Самокат и Яндекс.Лавка
- Airbnb

Я сильно расстроюсь, если этих сервисов не станет в моей жизни.

Что нравится в работе на рынке России и что раздражает?

Нет таких вещей. У любого рынка есть свои ограничения и обычно они создают новые возможности.

Чем порадуете аудиторию в ближайшее время?

У нас планируется большой запуск, который поможет еще больше стереть языковые границы и потреблять контент из первоисточников. К сожалению, запуск под NDA.

Яндекс или Google? Почему? (Дурацкий вопрос в данном контексте!)

Последние 7 лет я работаю в Яндексе. Яндекс не такой большой, как Google и ты можешь отвечать за большие вещи. У Яндекса есть разные направления бизнеса и есть возможность создавать совершенно разные продукты. Я занималась развитием продуктов про сбор и обработку данных, потом маркетплейсом, дальше производством еды, а теперь продуктом полностью построенном на ML технологиях. Для меня ценно, что можно делать такие переходы. Каждый такой переход дает большой толчок для профессионального развития и помогает быстрее расти продуктам. Из минусов Яндекса — это сильный фокус на русскоязычном рынке, но это постепенно меняется.

Что бы ты сказала Марку Цукербергу если бы оказалась перед ним?

Показала бы один из наших последних прототипов. Попробовала бы договориться о сотрудничестве или попросила посоветовать людей, которым это могло бы быть интересно. — Настоящий продакт! Использует любую возможность для поиска точек роста своего продукта (примечание автора ;))

Все репортажи в рубрике #ПокаВсеВОфисе можно найти на сайте http://merkushev.ru/intheoffice/ — заходите и выбирайте интересные вам сюжеты, их там уже больше 40.

Чтобы не пропустить следующий репортаж, подписывайтесь на мой канал в Телеграме: https://t.me/vladimir_merkushev

--

--

Vladimir Merkushev
Vladimir Merkushev

Written by Vladimir Merkushev

Product manager with 10+ years of experience in online classifieds and marketplaces. Subscribe to my Telegram channel: https://t.me/vladimir_merkushev