Наши проекты

Енот Поискун: Государственные закупки

Енот Поискун: сервис поиска и подписки на информацию о государственных закупках

portfoliosmall
Енот Поискун

Енот Поискун - это система поиска и отслеживания коммерческой информации о государственных закупках в Российской Федерации. Помимо непосредственно поиска по закупкам система предоставляет обширные возможности поиска государственных и коммерческих организаций участников размещения заказов.

Проект Енот Поискун был начат в 2007 году и именно в нём были реализованы многие из используемых нами технологий. В проекте были применены следующие наши разработки:

Извлечение информации о государственных закупках

Для обеспечения сбора информации о государственных заказах было написано более 60 парсеров информации cо всех существующих федеральных и региональных систем государственных закупок. Все парсеры были разработаны на языке программирования Python, включали механизмы распознавания и преобразования кодировок веб-страниц и соотнесения собранной информации с объектами в базе данных проекта.

Автоматическая классификация закупок

Одной из проблем извлечения информации о закупках оказалось то что в лишь в редких случаях доступна информация о предметной классификации закупок. Для того чтобы эту классификацию обеспечить был использован один из существующих рубрикаторов ТКГН и были разработаны специализированные правила классификация на основе ключевых слов и регулярных выражений по наличию которых анализировались предметы закупок. Эта технология позволила предоставить пользователям сайта возможность искать интересующие их заказы по кодам классификации.

portfoliosmall
Геоклассификация закупок и организаций

Особенностью проекта является возможность просмотра любой из закупок или организаций в на картах Google Maps и Карт Яндекса, а также наличием у них географических меток. Эти метки автоматически присваиваются им в процессе анализа ранее собранной информации.

Автоматическая конвертация документов

Практически для любой закупки справедливо, то что к ней прилагается не менее одного документа - извещения, документации, протоколов. В большинстве случаяев эти документы предоставляются в неудобном для пользователя виде и именно для этой цели был создан сервис автоматического преобразования документов из форматов Microsoft Office и других в формат HTML с последующей очисткой результатов и постраничным разбиением документов.

portfoliosmall
Создание и наполнение каталога веб-сайтов

В рамках проекта был создан специализированный каталог веб-сайтов куда вошли ссылки на официальные сайты публикации информации о заказах, сайты органов государственной власти, региональных и муниципальных сайтов закупок и организаций. Для создания и поддержания каталога были разработаны специальные инструменты поиска сайтов посвящённым закупкам в Рунете, а также автоматическое наполнение каталога скриншотами страниц сайтов и ссылками на RSS ленты.