пятница, 2 декабря 2016 г.

Компания Postgres Professional приняла участие в конференции «Технологии Баз Данных 2016»

          29-30 ноября прошла конференция «Технологии Баз Данных 2016». Ее организовали издательство «Открытые Системы» и их агентство OSP-con. Это первая их конференция с такой узко определенной тематикой, до этого в том же месте (гостиница «Интурист-Коломенское») они проводили конференции по Технологиям Больших Данных. Круг докладчиков и посетителей этих двух конференций, да и темы докладов сильно пересекаются, но залы были полными, и кулуарное общение было довольно интенсивным.

          Конференция должна была открыться концептуальным докладом Сергея Кузнецова (МГУ, ИСП РАН), но он не смог прийти из-за болезни, таким образом открывал конференцию доклад о ClickHouse — распределенной аналитической СУБД с открытым исходным кодом. О ней рассказывал представитель «Яндекса» Алексей Миловидов, определив ее нишу: некоторый класс промежуточных задач — анализ более структурированных данных, чем в базах key-value, но не требующих сложных JOIN-ов.

          Тема ниш продолжилась в докладе от Oracle. В своем интересном полемическом (если не сказать провокационном) докладе Марк Ривкин "отдувался" за всех производителей коммерческих универсальных СУБД (подразумевались IBM DB2 и Microsoft SQL Server). Он представил обширный список черт, которые либо недостижимы, либо недостаточно развиты в "нишевых СУБД" (к ним, собственно, причислялись докладчиком все остальные СУБД). Этот доклад как бы стал системой координат для остальных выступающих, которым ко всему прочему предстояло определиться со степенью "нишевости" и зрелостью возможностей рассматриваемых СУБД.

          Postgres Professional представляли Александр Коротков и Иван Панченко — соответственно в потоках технологических и практических докладов. Коротков рассказывал о новых возможностях полнотекстового поиска, разработанных в стенах нашей компании и доступных в последних релизах postgreSQL 9.6.x: объяснял необходимость нового типа индексов — RUM, и проблемы, которые он решает (медленное ранжирование, медленное упорядочение по timestamp). RUM это усовершенствованный обратный индекс GIN, в котором могут содержаться позиции лексем, rank и timestamp. Другое новшество PostgreSQL 9.6 это оператор <-> (FOLLOWED BY), который необходим для фразового поиска. Раньше поиск по конструкции "А & Б" давал тот же результат, что и "Б & А", а это, конечно, совершенно не адекватно желаниям большинства пользователей. Новый оператор к тому же позволяет настраивать поиск по принципу "Б не дальше, чем на 5 слов от А".


          Иван Панченко рассказывал (представитель МО Тенгиз Алания не смог приехать) о переходе на PostgreSQL с Oracle (другими кандидатами были MariaDB и Tibero) в администрации Московской Области, вообще известной активностью в переходе на новые технологии с открытым кодом. База данных обслуживала Межведомственную Систему Электронного Документооборота с более, чем 40 тысячами пользователей и 5.5 ТБ новых данных за месяц.


          В данном случае переход на PostgreSQL не только не ухудшил характеристики системы, но и убыстрил запросы (иногда на порядок), не потребовав новых вычислительных ресурсов. Стоимость проекта оказалась меньше приблизительно на порядок.

          Второй день был посвящен технологическим докладам самой резной тематики, таким, например, как «Кредитный скоринг на основе формальных понятий» или «Поиск закономерностей в базе данных демографических последовательностей на основе узорных структур», которые представили разработчики из НИУ ВШЭ. Об «ускорении исполнения SQL-запросов к распределенной базе данных в СУБД PostgreSQL с использованием динамической компиляции рассказал Д.Мельник из ИСП РАН.

Игорь Левшин

Полезные ссылки:


Поделись этим