Читатели CNews, отраслевые аналитики и эксперты Oracle подвели итоги онлайн-дискуссии на тему больших данных, прошедшей на CNews в конце 2014 г. Выбраны три определения Big Data, наиболее полные и значимые для российского бизнес-сообщества.
В ноябре–декабре 2014 г. аудитория CNews вела первую открытую онлайн-дискуссию о лучшем определении термина Big Data. Проект был реализован в сотрудничестве с компанией Oracle, объявившей «Год больших данных в России».
К открытому обсуждению на новой площадке CNews присоединились эксперты, журналисты, преподаватели и представители компаний, уже использующих технологии обработки больших данных или рассматривающих их к внедрению. Участники предлагали свои определения, спорили, задавали вопросы экспертам. В течение четырех недель читатели CNews и ведущие эксперты отрасли пытались определить, что на самом деле стоит за термином «большие данные» — одновременно и популярным, и пока неоднозначным. По окончании дискуссии, в ходе голосования и по итогам экспертной оценки были выбраны три наиболее полных и точных определения больших данных. Их авторами оказались представители компаний-заказчиков.
Выбор читателей: фокус на прикладном применении
К знаменитым три «V» (volume, velocity, variety) из определения больших данных агентства Gartner многие добавляют четвертое — value, имея ввиду, что новые технологии обязательно должны приносить пользу бизнесу. Определение, в котором делался упор на прикладном анализе больших данных, получило наибольшее число (45%) голосов от читателей CNews в ходе открытого голосования. «Большие данные – это слабо структурированная информация очень большого объема, используемая для анализа и дальнейшей работы. Как именно — зависит от задач и специфики деятельности компании», — так говорилось в самой популярной трактовке среди читателей.
Отвечая на вопросы читателей CNews, заданные в ходе дискуссии, старший вице-президент Oracle по технологиям в регионе ЕМЕА Эндрю Сазерленд — гуру с мировым именем в управлении данными — также подчеркнул, что новый стек решений в первую очередь должен нести ценность для бизнеса: «В Big Data первостепенное значение имеет конечный результат, а не сами технологии. Большие данные позволяют извлекать пользу из данных, которые казались мусором. При этом данных не обязательно должно быть много. Важнее, что в них может скрываться ценная информация, которую невозможно извлечь классическими методами. Если вы обнаружили неочевидную ранее пользу от данных, вы решили задачу класса Big Data. И неважно, какие вы применяли при этом технологии. Полученная выгода здесь важнее всего».
Тема практического применения технологий больших данных с эффектом для бизнеса прошла красной нитью через всю онлайн-дискуссию. Своим мнением делились сотрудники организаций самых разных масштабов и отраслей: банки, страховые компании, ИТ, медицина, юриспруденция, промышленность, энергетика, интернет-сервисы. Обмен опытом особенно важен, когда основная масса компаний только присматривается к новым технологиям. Именно чтобы распространять накопленный опыт, испанский CaixaBank и Oracle создали в Барселоне Центр экспертизы по Big Data. В нем создаются новые прикладные решения на основе технологий Oracle для работы с большими данными для различных отраслей, включая финансовый сектор. Центр компетенций аккумулирует лучшие практики применения таких решений.
Выбор редакции: большая аналитика
Big Data дарят новые возможности для аналитики и поиска закономерностей, позволяя извлекать из больших данных полезные знания. Эту черту новых технологий в редакции CNews считают одной из самых важных, поэтому аналитики издания отметили следующее определение: «Я вижу Big Data как статистику 2.0, с большей выборкой, с большим набором инструментов, позволяющим находить новые и уточнять известные закономерности. Для пенсионного сектора — и для страхового, и для финансового в целом — эти технологии могут быть прорывными, позволяя сделать более точными актуарные исследования, удешевить существующие продукты, сделать пенсионные фонды более устойчивыми».
Современный мир диктует моду на «умные» города, «умные» дома, «умные» машины. Но в наш информационный век, когда все больше людей зарабатывают на хлеб умственным трудом, растет спрос на инструменты, помогающие принимать «умные» решения, основанные на анализе абсолютно всей доступной информации.
Выбор экспертов: новые возможности масштабирования
Отличительной чертой технологий для обработки больших данных является их способность подстраиваться под динамично меняющиеся объемы бизнеса. К числу наиболее емких определений эксперты отнесли следующее: «Это набор технологий, максимально ориентированный на горизонтальное масштабирование. Есть мнение, что горизонтально масштабировать проект менее чем на 100 серверов неэффективно из-за затрат на разработку решений для параллелизации и оверхеда разнесенного вычислительного процесса. К технологии Big Data прибегают, когда в рамках вертикального масштабирования решить задачи невозможно».
Таким образом, участники онлайн-дискуссии приблизились к достаточно ясному пониманию феномена «большие данные». «Хотя термин говорит о данных, все интуитивно понимают, что он не только об объеме данных, но также о их сущности, технологиях работы с ними и, конечно, ценности этих данных для бизнеса», — резюмирует Андрей Пивоваров, руководитель группы перспективных технологий предпроектного консалтинга Oracle СНГ.
Ход дискуссии в целом продемонстрировал, что российский бизнес уже хорошо представляет себе суть и возможности Big Data. Высокая степень осмысления проблемы больших данных может оказаться последней ступенью перед широким практическим применением этих технологий. «Я чувствую, что рынок сделал глубокий вдох перед тем как начать действительно серьезные инвестиции в Big Data», — так трактовал текущее отношение российского рынка к Big Data Эндрю Сазерленд.
Авторов трех наиболее значимых определений ждут призы от организаторов.
История о том, как построить конкурентоспособную бейсбольную команду, несмотря на отсутствие больших финансовых возможностей, но с помощью анализа нужных данных.
«Человек, который изменил все» (Money ball)