На чте­ние: 0.12 mintue

Новый сер­вис будет поле­зен как спе­ци­а­ли­стам раз­лич­ных обла­стей, так или ина­че свя­зан­ных с исто­ри­ей, так и обыч­ным людям.

Яндекс запу­стил новый сер­вис «Поиск по архи­вам», в осно­ве кото­ро­го лежат ста­рые архи­вы (более чем 2,5 млн стра­ниц исто­ри­че­ских доку­мен­тов) с тек­сто­вой рас­шиф­ров­кой, сде­лан­ной ней­ро­се­тя­ми. Это ста­ло воз­мож­ным бла­го­да­ря тех­но­ло­гии, бази­ру­ю­щей­ся на опти­че­ском рас­по­зна­ва­нии сим­во­лов, — она учи­ты­ва­ет осо­бен­но­сти почер­ка, узна­ёт пере­став­шие исполь­зо­вать­ся бук­вы и пони­ма­ет осо­бую струк­ту­ру архив­ных документов.

Нейросети обу­ча­лись на сот­нях тысяч реаль­ных руко­пис­ных доку­мен­тов, дати­ру­е­мых 18 и 19 века­ми, а так­же на десят­ках мил­ли­о­нов сге­не­ри­ро­ван­ных образ­цов. Всё это кон­тро­ли­ро­ва­лось экспертами.

«Для рас­шиф­ров­ки одной стра­ни­цы архив­но­го руко­пис­но­го тек­ста про­фес­си­о­на­лу может потре­бо­вать­ся до полу­ча­са вре­ме­ни, а наш сер­вис справ­ля­ет­ся с этим за несколь­ко секунд, — гово­рит руко­во­ди­тель Поиска Яндекса Елена Бубнова. — В пер­спек­ти­ве тех­но­ло­гию мож­но исполь­зо­вать и для реше­ния дру­гих задач в про­дук­тах Яндекса».

«Поиск по архи­вам» создан не ради демон­стра­ции тех­но­ло­гий, а для реаль­ной помо­щи людям: сер­вис ока­жет­ся полез­ным исто­ри­кам, социо­ло­гам, демо­гра­фам, гене­а­ло­гам и даже обыч­ным людям, ищу­щим инфор­ма­цию о сво­ей семье. Сервис поз­во­ля­ет быст­ро нахо­дить доку­мен­ты с нуж­ным клю­че­вым сло­вом, будь то имя, назва­ние горо­да или что угод­но другое.

На дан­ный момент ката­лог сай­та бази­ру­ет­ся на Главархиве Москвы, а так­же на архи­вах Оренбургской и Новгородской обла­стей. В буду­щем база дан­ных будет расширяться.

Источник мате­ри­а­ла: TrashBox

Televid
Author: Televid