Большим данным — большая ниша

Станислав Кизима, директор Центра исследований систем обработки больших данных.

ЭС: Станислав Васильевич, с какими достижениями вы пришли к финишу Года науки в России?

— Разработана Концепция создания общего электронного пространства информационных ресурсов и сервисов на основе распределенных центров и систем больших данных различной принадлежности.

Документ обобщает проблематику в области больших данных, определяет основные технологические решения, сводные интегральные информационные ресурсы и сервисы, топологию, главные направления работ и этапы создания интегрирующих компонент в области формирования общего цифрового электронного информационного пространства больших данных. Концепция предусматривает, что такие ресурсы будут доступны любому субъекту цифрового общества в режиме одного окна.

ЭС: Что конкретно с точки зрения потребителя вбирает в себя понятие «сервисы на основе Big Data»?

— Существует множество интересных направлений, которые в настоящее время не реализованы. И здесь у центра большое поле востребованных работ и ожидаемых результатов.

Уже существующие сервисы в основном имеют корпоративную направленность — с точки зрения и потребителей, и информационных ресурсов больших данных. Наряду с этим потенциально востребованы сервисы, которым для работы нужны данные не из одной конкретной системы, а из нескольких, причем различной принадлежности. Информацию о доступных технологиях, ресурсах, сервисах и аналитике на основе больших данных, о способах доступа к ним будут аккумулировать интегрирующие компоненты.

Технологии больших данных стремительно развиваются, и при создании автоматизированных технологических и информационных систем многие работы дублируются, а значит, нужен сервис конструктора ЦОДов. Подходы к конструированию ЦОДов должны
быть унифицированы и опираться на лучшие практики. Это позволит сформировать интеллектуальный калькулятор, с помощью которого любой потребитель сможет ввести в программу свои запросы, а сервис, «разбирающийся» в Big Data, в оборудовании и программном обеспечении (ПО), сделает соответствующий предпроектный расчет.

Для каких задач, какие конкретно информационные ресурсы нужны, куда за ними обращаться, какие вычислительные мощности требуются — все это вопросы системного обеспечения решений на основе Big Data.

Актуальна проблематика определения стоимости ресурсов данных. Действующих методик и сервисов, позволяющих оценить тот или иной раздел больших или малых данных, чтобы вывести на рынок некий информационный продукт, нет.

Многие организации проектируют собственные автоматизированные технологические и информационные системы и, как правило, «с нуля». В них зачастую реализуются разделы одних и те же однотипных по фактуре и содержанию данных. Сократить трудозатраты и сэкономить финансовые средства помогут библиотеки ресурсов, унифицированных по структуре и содержанию. Нам предстоит формировать структуры и информационное содержание типовых разделов данных. От того, как данные структурированы и взаимосвязаны, зависят качество и эффективность работы аналитических сервисов.

В концепции перечислены ключевые практические задачи, определены этапы создания специализированных ресурсов, предусмотрена распределенная инфраструктура, из чего следует, что большие данные не будут «собираться» в одном месте.

ЭС: Что нужно для формирования общего цифрового информационного пространства на базе больших данных?

— Необходимы централизующие компоненты и интеллектуальная система, аккумулирующие информацию и формирующие сервисы, которые основаны на ресурсах распределенных центров и систем больших данных различной принадлежности. Телекоммуникационная инфраструктура, без которой невозможны ни формирование больших данных, ни доступ к ресурсам и сервисам на их базе, а также сеть интернет, система информационной без- опасности и многое другое — без этого нельзя реализовать ключевые положения Концепции.

ЭС: Кто ваш потребитель?

— Как прописано в Концепции: все, что разрабатывается, разрабатывается в интересах всех субъектов потребителей цифрового общества. Это означает, что потребителями являются все субъекты физических и юридических лиц, коммерческих структур, государственных ведомств.

ЭС: Приведите, пожалуйста, примеры фундаментальных исследований.

— Фундаментальные профильные разработки — это все, что касается создания классификатора предметной области больших данных, упорядоченной системы параметрических моделей и систематизированных метрик основных объектов и процессов предметной области больших данных, методик. Здесь же методики и ПО оценки значений параметров и количественных показателей объемов, условного удельного веса, ранга значимости, эффективности и качества объектов, процессов, информационных ресурсов, аналитики, услуг, сервисов, автоматизированных, информационных, технологических систем и центров обработки данных и т. д.

Кроме того, к фундаментальным профильным разработкам относится все, что касается определения объективных содержательных индикаторов наличия, доступности и качества телеком-инфраструктуры, являющейся как генератором технологических разделов больших данных, так и средой доступа к ресурсам на базе больших данных. Сюда же следует включить основанные на этих данных методики и сервисы формирования обоснованных программ развития и расчетов объемов требуемых инвестиций.

В задачи центра на ближайшую перспективу входит и разработка сервисов, предоставляющих информацию о наличии и доступности телеком-инфраструктуры, используя которую потребитель мог бы найти нужные ему решения для реализации своей бизнес-модели (офис, склад, магазин, производство) и построить «предпроект» необходимой сети связи и передачи данных. Мы хотим аккумулировать всю информацию, сделать ее открытой, размещать необходимые ресурсы и сервисы на публичном сервере. Любой оператор больших данных или телеком-инфраструктуры получает возможность продекларировать там свои предложения, а любой потребитель — нащелкать «мышкой» точки пространства, сформулировать свою задачу и получить необходимые технологические решения.

Рубрики и ключевые слова