Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации
FONTANKA
Погода

Сейчас-1°C

Сейчас в Санкт-Петербурге
Погода-1°

небольшая облачность, без осадков

ощущается как -5

3 м/c,

штиль.

750мм 75%
Подробнее
3 Пробки
USD 102,58
EUR 107,43
Технологии Новые российские технологии Битва роботов. «Помощник» с «Госуслуг» спешит в регионы

Битва роботов. «Помощник» с «Госуслуг» спешит в регионы

10 603

Уже до конца года региональные информационные сервисы оснастят функцией автоматизированного поиска услуг, которая уже известна пользователем «Госуслуг» под именем «Робот Макс». «Фонтанка» по-новому взглянула на двухлетней давности игрушку и рассказывает, почему она не избавит горожан от общения с живыми людьми в окошках госведомств.

Функционал робота доработают и до конца года завершат его миграцию на платформу «Гостех», — сообщили в конце недели «Ведомости». После этого региональные разработчики получат возможность добавлять его на свои сайты.

Внедрение на петербургских госсайтах передовой поисковой системы с «Госуслуг» не станет панацеей от врожденных проблем, но сделает их чуточку понятнее гражданам. По крайней мере именно таковой была логика создания «Робота Макса». «Фонтанка» протестировала его работу и готова засвидетельствовать: многое у него получается. А больше от него и не требуется.

«Робот Макс» — разумеется, никакой не робот, несмотря на его аватар на сайте «Госуслуг». Заголовки даже самых серьезных госСМИ от 2021 года, вроде «Пользователей нового портала госуслуг будет консультировать робот», — не более чем метафора. Речь всего лишь о системе поиска по заголовкам статей об услугах, которые можно получить на портале. Как «Яндекс», но со своей спецификой.

Поскольку услуг этих многие тысячи, а подавляющее большинство пользователей портала не имеют научных степеней в области Search Engine Optimization (SEO), перед разработчиками этой системы стояла нетривиальная задача — научить своего «робота» переводить человеческий язык (зачастую с грубыми ошибками) на весьма специфический «канцелярский» язык, которым написаны и описаны госуслуги. Ну и как-то соединить все это в одной точке.

«Границы получения услуг, кому можно или нельзя, когда и как, описываются официальными формулировками. Часто используются канцеляризмы и аббревиатуры. Вместо «налоговая» — «ФНС» или «Федеральная налоговая служба». Вместо «ремонтировать» — «производить ремонт». Люди так не разговаривают. Но завтра же изменить язык государство не сможет. Законы и акты придется переписать, для новых внедрить редакционную политику, научить сотрудников. А госуслуги нужны сейчас. Так мы поняли, что людям нужен переводчик с «государственного», — рассказывал в своем блоге руководитель команды разработчиков «Робота Макса» Никита Устриков.

Тот рассказ был очень подробным и предназначен в первую очередь для специалистов-айтишников. Для обывателя же общий смысл сводился к формуле «все сложно» и наглядно иллюстрировался схемой архитектуры поисковика.

Нет смысла подробно описывать внутренности этого «робота», которые создавались командой в 70 человек одного из подразделений компании «РТЛабс» (структура Ростелекома). Достаточно просто понимать, как он работает.

В первую очередь запросы разделяются по длине. Это важно, ведь, по статистике, больше 70% запросов на «Госуслугах» состоит не более чем из трех слов, причем 49% — всего из одного.

Это означает, что в половине случаев «робот» оказывается один на один с человеком, который не может сформулировать, что ему нужно, и хочет, чтобы за него все придумали и сказали, куда идти, а в ряде случаев — зачем. И значит, задача поисковой системы тут будет не столько в поиске нужного ответа, сколько в выяснении, чего именно требуется клиенту.

На запрос пользователя, например, «паспорт», система должна для начала догадаться, о каком паспорте идет речь: общегражданском, заграничном, ветеринарном, паспорте транспортного средства, паспорте жилого дома и много еще вариантов паспортов. Далее надо понимать, что слово «паспорт» присутствует примерно во всех описаниях порядка получения госуслуг. Ну и напоследок — надо догадаться, что человек хочет с этим своим паспортом сделать: получить, поменять, продлить, забрать уже готовый и т.п.

В итоге, как убедилась «Фонтанка», для начала «Робот Макс» предлагает всего три варианта: «Что вас интересует — паспорт РФ, загранпаспорт, нет нужного ответа».

В самом простом и банальном случае — «Паспорт РФ» — «Макс» предлагает шесть, видимо, самых распространенных вариантов, включая банальное «оформить паспорт РФ» и нетривиальное «перенести визит». Далее идет интуитивно понятное дерево вариантов, которое ранее или позднее приводит человека на страницу, где он может либо заказать какую-то услугу, либо узнать, почему ему ничем нельзя помочь.

Если выбрать вариант «нет нужного ответа», начинается канитель. В первый раз он предложит три варианта, среди которых есть и «выдача паспорта на музыкальные инструменты и смычки». К своему стыду, мы не знали, что такое бывает, прошли дальше по этой ветке и все выяснили.

Если продолжать каждый раз жать «показать, что нашлось еще», можно узнать «что делать с паспортом умершего человека», «как заменить паспорт гражданина СССР» и даже «что такое паспорт». Где-то на седьмой итерации «Макс» начал повторяться, а к десятой начал предлагать совсем странное, вроде «как оформить ИНН на ребенка», «как получить выписку из ЕГРН» или оптимистичное «как получить паспорт без очередей и на 30% дешевле», а затем и вовсе подсунул адрес 3-го отделения Красносельского отдела по вопросам миграции МВД РФ.

1 из 4

Из объяснений Никиты Устрикова следовало, что, к примеру, по сути, одинаковые запросы — «какой размер пошлины за замену паспорта?» и «сколько платить за замену паспорта» — робот воспримет немного по-разному за счет появления слова «какой».

«Оно содержится в разметке для статьи «Штраф за просрочку замены паспорта», т.к. люди часто спрашивают именно: «Какой штраф...» Если вы введете фразы «размер пошлины за замену паспорта» и «сколько платить за замену паспорта», то Макс предложит одинаковые результаты», — объяснял «родитель» поисковой системы.

Потом «Фонтанка» намеренно написала слово «паспорт» с шестью разными ошибками (да, нам пришлось подумать), каждый раз Макс догадывался, что мы имеем в виду. Почти во всех случаях он просто показывал результаты выдачи по слову «паспорт», и лишь случае с «паспарт» он на всякий случай осторожно поинтересовался, действительно ли мы хотим посмотреть результаты поиска по такому слову. Если нажать «да», все равно все рассказывается про обычный паспорт РФ (а не загранпаспорт и не ветеринарный).

Итак, с первой — действительно непростой — задачей по встрече с незнакомым с бюрократической машиной человеком Макс пусть со скрипом, но справляется.

Дальше мы попробовали более конкретный вариант: «Как получить повторное свидетельство о рождении». Тут Макс блеснул. С первого раза выдал: кому можно получить такое, кому нельзя, куда идти и что делать.

Но это явно очень обычный и частый вопрос, так что мы задали действительно небанальную и редкую задачу: «Как многодетным получить компенсацию за взносы на капремонт в Петербурге». И тут Макс явно спасовал.

Ни в первой, ни во второй, ни в третьей итерации «показать, что нашлось еще» ничего даже примерно похожего не было. А когда на седьмой раз Макс предложил почитать «Правила выплаты компенсации на собаку-проводника», мы перестали над ним издеваться.

Тот же запрос в «Яндексе» первым же вариантом выдал нам ссылку на страничку того самого регионального ГИС Петербурга (в лице комитета по информатизации и связи), который сейчас будут оснащать роботом Максом, где все ясно и понятно описано по заданной проблеме.

1 из 2

Возможно, когда Макса «поженят» с петербургской системой госуслуг, ему будет проще искать ответы на наши мелкие провинциальные запросы. Пока же у него тут явный пробел. И очевидно, что любая «живая» сотрудница МФЦ или профильного ведомства сразу поймет, чего хочет человек, и даст ему исчерпывающий ответ. Хотя, конечно, нас много, а она одна.

Стоит отметить, что, когда система поиска, позже получившая название «Робот Макс», разрабатывалась в недрах экосистемы Ростелекома, компанией-разработчиком «РТЛабс» руководил не кто иной, как Максут Шадаев, нынешний глава Минцифры РФ.

К слову, к моменту релиза этой поисковой системы ее авторы подверглись довольно обидной критике от гуру отечественной IT-отрасли Игоря Ашманова, который в ряду огромного количества разнообразных достижений имеет опыт работы и с поисковыми технологиями, и с госзаказами.

«Мужики, вы переоткрываете для себя все мельчайшие грабли обычного информационного поиска по базе знаний. И рассказываете об этом как об откровении.

Прямо по всем шагам, умилительно. Разработчики внезапно узнают про машинную морфологию и основы слов! ШОК, Фото!!!

Потом про синонимы! Потом про проблему коротких текстов! Потом про поиск по каталогу!!! И т.п.

Вы, похоже, делали всё с нуля, «с мороза». Причём, похоже, сначала вам казалось, что нужно просто «правильно сформировать стек технологий» — и он всё сделает.

И вы в итоге справились: построили штуку уровня примерно 2001 года. На hunspell и таком же всяком.

А нельзя было просто нанять кого-то, кто знает, как это на самом деле делается? Люди же в отрасли есть. Куча народу работала в поиске Яндекса, в Мыле и т.п.

Более того, у вас там рядом должен был кто-то остаться из Спутника, где также все эти проблемы давно решены, и морфология своя, и поисковик, всё принадлежит РТ».

В открытом доступе комментариев этих слов ни от Ростелекома, ни от «РТЛабс» в лице хоть Максута Шадаева, хоть Никиты Устрикова не последовало.

Денис Лебедев, «Фонтанка.ру»

ПО ТЕМЕ
Лайк
LIKE0
Смех
HAPPY0
Удивление
SURPRISED0
Гнев
ANGRY0
Печаль
SAD0
Увидели опечатку? Выделите фрагмент и нажмите Ctrl+Enter
Комментарии
18
Присоединиться
Самые яркие фото и видео дня — в наших группах в социальных сетях