Уже до конца года региональные информационные сервисы оснастят функцией автоматизированного поиска услуг, которая уже известна пользователем «Госуслуг» под именем «Робот Макс». «Фонтанка» по-новому взглянула на двухлетней давности игрушку и рассказывает, почему она не избавит горожан от общения с живыми людьми в окошках госведомств.
Функционал робота доработают и до конца года завершат его миграцию на платформу «Гостех», — сообщили в конце недели «Ведомости». После этого региональные разработчики получат возможность добавлять его на свои сайты.
Внедрение на петербургских госсайтах передовой поисковой системы с «Госуслуг» не станет панацеей от врожденных проблем, но сделает их чуточку понятнее гражданам. По крайней мере именно таковой была логика создания «Робота Макса». «Фонтанка» протестировала его работу и готова засвидетельствовать: многое у него получается. А больше от него и не требуется.
«Робот Макс» — разумеется, никакой не робот, несмотря на его аватар на сайте «Госуслуг». Заголовки даже самых серьезных госСМИ от 2021 года, вроде «Пользователей нового портала госуслуг будет консультировать робот», — не более чем метафора. Речь всего лишь о системе поиска по заголовкам статей об услугах, которые можно получить на портале. Как «Яндекс», но со своей спецификой.
Поскольку услуг этих многие тысячи, а подавляющее большинство пользователей портала не имеют научных степеней в области Search Engine Optimization (SEO), перед разработчиками этой системы стояла нетривиальная задача — научить своего «робота» переводить человеческий язык (зачастую с грубыми ошибками) на весьма специфический «канцелярский» язык, которым написаны и описаны госуслуги. Ну и как-то соединить все это в одной точке.
«Границы получения услуг, кому можно или нельзя, когда и как, описываются официальными формулировками. Часто используются канцеляризмы и аббревиатуры. Вместо «налоговая» — «ФНС» или «Федеральная налоговая служба». Вместо «ремонтировать» — «производить ремонт». Люди так не разговаривают. Но завтра же изменить язык государство не сможет. Законы и акты придется переписать, для новых внедрить редакционную политику, научить сотрудников. А госуслуги нужны сейчас. Так мы поняли, что людям нужен переводчик с «государственного», — рассказывал в своем блоге руководитель команды разработчиков «Робота Макса» Никита Устриков.
Тот рассказ был очень подробным и предназначен в первую очередь для специалистов-айтишников. Для обывателя же общий смысл сводился к формуле «все сложно» и наглядно иллюстрировался схемой архитектуры поисковика.
Нет смысла подробно описывать внутренности этого «робота», которые создавались командой в 70 человек одного из подразделений компании «РТЛабс» (структура Ростелекома). Достаточно просто понимать, как он работает.
В первую очередь запросы разделяются по длине. Это важно, ведь, по статистике, больше 70% запросов на «Госуслугах» состоит не более чем из трех слов, причем 49% — всего из одного.
Это означает, что в половине случаев «робот» оказывается один на один с человеком, который не может сформулировать, что ему нужно, и хочет, чтобы за него все придумали и сказали, куда идти, а в ряде случаев — зачем. И значит, задача поисковой системы тут будет не столько в поиске нужного ответа, сколько в выяснении, чего именно требуется клиенту.
На запрос пользователя, например, «паспорт», система должна для начала догадаться, о каком паспорте идет речь: общегражданском, заграничном, ветеринарном, паспорте транспортного средства, паспорте жилого дома и много еще вариантов паспортов. Далее надо понимать, что слово «паспорт» присутствует примерно во всех описаниях порядка получения госуслуг. Ну и напоследок — надо догадаться, что человек хочет с этим своим паспортом сделать: получить, поменять, продлить, забрать уже готовый и т.п.
В итоге, как убедилась «Фонтанка», для начала «Робот Макс» предлагает всего три варианта: «Что вас интересует — паспорт РФ, загранпаспорт, нет нужного ответа».
В самом простом и банальном случае — «Паспорт РФ» — «Макс» предлагает шесть, видимо, самых распространенных вариантов, включая банальное «оформить паспорт РФ» и нетривиальное «перенести визит». Далее идет интуитивно понятное дерево вариантов, которое ранее или позднее приводит человека на страницу, где он может либо заказать какую-то услугу, либо узнать, почему ему ничем нельзя помочь.
Если выбрать вариант «нет нужного ответа», начинается канитель. В первый раз он предложит три варианта, среди которых есть и «выдача паспорта на музыкальные инструменты и смычки». К своему стыду, мы не знали, что такое бывает, прошли дальше по этой ветке и все выяснили.
Если продолжать каждый раз жать «показать, что нашлось еще», можно узнать «что делать с паспортом умершего человека», «как заменить паспорт гражданина СССР» и даже «что такое паспорт». Где-то на седьмой итерации «Макс» начал повторяться, а к десятой начал предлагать совсем странное, вроде «как оформить ИНН на ребенка», «как получить выписку из ЕГРН» или оптимистичное «как получить паспорт без очередей и на 30% дешевле», а затем и вовсе подсунул адрес 3-го отделения Красносельского отдела по вопросам миграции МВД РФ.
Из объяснений Никиты Устрикова следовало, что, к примеру, по сути, одинаковые запросы — «какой размер пошлины за замену паспорта?» и «сколько платить за замену паспорта» — робот воспримет немного по-разному за счет появления слова «какой».
«Оно содержится в разметке для статьи «Штраф за просрочку замены паспорта», т.к. люди часто спрашивают именно: «Какой штраф...» Если вы введете фразы «размер пошлины за замену паспорта» и «сколько платить за замену паспорта», то Макс предложит одинаковые результаты», — объяснял «родитель» поисковой системы.
Потом «Фонтанка» намеренно написала слово «паспорт» с шестью разными ошибками (да, нам пришлось подумать), каждый раз Макс догадывался, что мы имеем в виду. Почти во всех случаях он просто показывал результаты выдачи по слову «паспорт», и лишь случае с «паспарт» он на всякий случай осторожно поинтересовался, действительно ли мы хотим посмотреть результаты поиска по такому слову. Если нажать «да», все равно все рассказывается про обычный паспорт РФ (а не загранпаспорт и не ветеринарный).
Итак, с первой — действительно непростой — задачей по встрече с незнакомым с бюрократической машиной человеком Макс пусть со скрипом, но справляется.
Дальше мы попробовали более конкретный вариант: «Как получить повторное свидетельство о рождении». Тут Макс блеснул. С первого раза выдал: кому можно получить такое, кому нельзя, куда идти и что делать.
Но это явно очень обычный и частый вопрос, так что мы задали действительно небанальную и редкую задачу: «Как многодетным получить компенсацию за взносы на капремонт в Петербурге». И тут Макс явно спасовал.
Ни в первой, ни во второй, ни в третьей итерации «показать, что нашлось еще» ничего даже примерно похожего не было. А когда на седьмой раз Макс предложил почитать «Правила выплаты компенсации на собаку-проводника», мы перестали над ним издеваться.
Тот же запрос в «Яндексе» первым же вариантом выдал нам ссылку на страничку того самого регионального ГИС Петербурга (в лице комитета по информатизации и связи), который сейчас будут оснащать роботом Максом, где все ясно и понятно описано по заданной проблеме.
Возможно, когда Макса «поженят» с петербургской системой госуслуг, ему будет проще искать ответы на наши мелкие провинциальные запросы. Пока же у него тут явный пробел. И очевидно, что любая «живая» сотрудница МФЦ или профильного ведомства сразу поймет, чего хочет человек, и даст ему исчерпывающий ответ. Хотя, конечно, нас много, а она одна.
Стоит отметить, что, когда система поиска, позже получившая название «Робот Макс», разрабатывалась в недрах экосистемы Ростелекома, компанией-разработчиком «РТЛабс» руководил не кто иной, как Максут Шадаев, нынешний глава Минцифры РФ.
К слову, к моменту релиза этой поисковой системы ее авторы подверглись довольно обидной критике от гуру отечественной IT-отрасли Игоря Ашманова, который в ряду огромного количества разнообразных достижений имеет опыт работы и с поисковыми технологиями, и с госзаказами.
«Мужики, вы переоткрываете для себя все мельчайшие грабли обычного информационного поиска по базе знаний. И рассказываете об этом как об откровении.
Прямо по всем шагам, умилительно. Разработчики внезапно узнают про машинную морфологию и основы слов! ШОК, Фото!!!
Потом про синонимы! Потом про проблему коротких текстов! Потом про поиск по каталогу!!! И т.п.
Вы, похоже, делали всё с нуля, «с мороза». Причём, похоже, сначала вам казалось, что нужно просто «правильно сформировать стек технологий» — и он всё сделает.
И вы в итоге справились: построили штуку уровня примерно 2001 года. На hunspell и таком же всяком.
А нельзя было просто нанять кого-то, кто знает, как это на самом деле делается? Люди же в отрасли есть. Куча народу работала в поиске Яндекса, в Мыле и т.п.
Более того, у вас там рядом должен был кто-то остаться из Спутника, где также все эти проблемы давно решены, и морфология своя, и поисковик, всё принадлежит РТ».
В открытом доступе комментариев этих слов ни от Ростелекома, ни от «РТЛабс» в лице хоть Максута Шадаева, хоть Никиты Устрикова не последовало.
Денис Лебедев, «Фонтанка.ру»