Глобалният пазар на големи данни и анализи е на стойност 274 милиарда долара. Всеки ден в световен мащаб се генерират около 2,5 квинтилиона байта данни, в резултат на което към днешна дата в цялата цифрова вселена има над 44 зетабайта данни. 70% от тях са генерирани от потребители.
Разходите на крайните потребители за изчисления в облака възлизат на около 500 млрд. долара годишно.
Всички тези статистики на някои от водещите анализаторски компании недвусмислено показват, че големите данни не само са в основата на развитието на технологии на бъдещето като изкуствения интелект, но също така играят ролята на катализатор за цифровата трансформация на бизнеса.
Но какво точно представляват големите данни и защо се очаква да играят основна роля за еволюционното развитие на голяма част от индустриите? Какви са предизвикателствата, които големите данни поставят пред компаниите, преди да се превърнат в източник на конкурентни предимства? Къде живеят големите данни и какви са изискванията за тяхното съхранение и обработка?
Отговорите на тези въпроси дава Андрей Расийски, управляващ партньор в консултантската компания Alma Consulting, която повече от година работи в тясно сътрудничество с водещия доставчик на колокация и центрове за данни „Телепоинт“. Той има 30 години опит в сферата на ИКТ и е заемал ръководни позиции в компании в няколко държави.
Андрей Расийски има две специализации по цифрова стратегия и иновации в Масачузетски технологичен институт (MIT) и магистърски степени - по бизнес администрация от IE Business School и по компютърни науки от Нов български университет (НБУ).
В последните години един от основните технологични термини е „големи данни“. Какво се крие зад него?
Този термин описва структурирана, полуструктурирана или неструктурирана информация, която се генерира от работата на различни индустрии и има различна стойност по отношение на начина, по който се прави един бизнес. Има компании, за които данните са много важни, има и такива, които просто ги генерират, но не ги използват толкова.
През последните години големите данни са навсякъде около нас. Те се генерират от почти всяка една човешка дейност и могат да бъдат както проблем с нуждата от съхранение, така и предимство, ако се анализират.
Какви са тенденциите в тази технологична сфера?
Големите данни са свързани с един феномен, наречен цифрова икономика или икономика на битовете, който възниква на базата на комбинация на три технологични групи – машините, платформите и разпределеното знание.
В случая термина „машини“ се използва като съвкупно понятие за всякакъв вид съвременни технологии – изкуствен интелект, 3D принтиране, дронове, невронни мрежи и т.н. Вторият стълб – платформите, включва всички бизнеси, които използват платформени бизнес модели. Пример за такъв е Uber.
Идеята на този тип платформи е да съберат на едно място търсенето и предлагането и да ги предоставят като услуга. В случая с Uber компанията свързва хора, които търсят превоз, с други, които искат да работят като таксиметрови шофьори.
Друг пример за подобен бизнес модел е Airbnb. Има много хора, които отдават апартаменти временно или дългосрочно под наем, има и такива, които търсят да наемат. Те се свързват през платформата и едните получават услугата от другите. В резултат на това Airbnb има по-голяма пазарна капитализация от която и да е световна хотелска верига в момента, а нямат нито един хотел.
Това е феноменът на цифровата икономика – платформените бизнес модели позволяват създаването на бизнес, който не притежава активи в класическия смисъл на думата, но е толкова мощен, че надминава традиционните представители на сектора си.
Под разпределено знание пък се има предвид процес, който не разчита на експертизата на една компания, а на събирането на малки количества информация от милиони хора в дадена страна, регион или локация, която да нарисува пълната картина. Концепцията е същата като при торентите и се нарича crowdsourcing.
Тези направления са в основата на цифровата икономика, но всяко от тях има аналог в класическата. На машините аналог е човешкият разум, на платформените бизнес модели – продуктите и стоките, които хората произвеждат, а на разпределеното знание – централизираното знание, тъй като всяка една компания се стреми да създаде такова за това как прави бизнес.
Цифровата и класическата икономика не са във война. Те се допълват и се развиват, работят заедно за това човечеството да върви напред, а големите данни са хранителната среда за цифровата икономика. За ChatGPT например големите данни са това, което е за малкото дете обкръжаващия го свят.
По друг начин казано, няма цифрова икономика без големи данни.
Как всички тези големи данни помагат на бизнеса?
Ако съвременните бизнеси искат да участват в цифровата икономика, те при всички случаи трябва да използват големи данни. Без да бъдат в състояние да възприемат, анализират обработват и генерират големи данни посредством някоя от тези три групи технологии, те няма как да участват в нея.
Класическата икономика или икономиката на атомите възниква паралелно с възникването на човешката цивилизация. Но тази на битовете започва с появата на компютрите и интернет, което дава началото на генерирането на големите данни. В нейното сърце стои т.нар. цифрова стока, без която също не може да има цифрова икономика.
Класически пример за цифрова стока са софтуерните продукти и MP3 файловете, докато аналоговите продукти не отговарят на тези изисквания.
Ако един бизнес иска да навлезе в цифровата икономика задължително трябва да използва данните като хранителна среда и да дефинира цифровата стока, която е в основата на неговия бизнес модел. Именно данните помагат за изграждането на тази дефиниция.
Кои са най-високо интензивните индустрии по отношение на данните и какви нужди поражда този интензитет за тях?
Под индустрии с интензивно използване на информация и данни се разбират такива, които генерират огромни количества данни, които ги използват интензивно и за които загубата на данни ще бъде критична от бизнес гледна точка. Анализът, който направихме в „Телепоинт“, базиран на класификацията на ОИСР, извежда сред лидерите целия сектор, свързан с ИКТ – телекоми, софтуерни компании, и т.н.
Финансовият сектор също е високо интензивна индустрия, защото там се генерират огромни обеми от данни.
Трети пример е здравеопазването, където има включително регулаторни изисквания, които задължават лечебните заведения да пазят събираната информация за определен период от време.
Всички маркетингови проучвания, бизнес услугите, рекламата също попадат в групата на индустриите с висок интензитет на използването на данни.
Примери за обратното са селското стопанство и добивната индустрия, където също се генерират данни, но не в такъв мащаб.
По отношение на България, според нашите анализи, около 24% от българската икономика е с интензивно използване на големи данни. В това число влизат телекомуникациите и ИКТ, производството на машини и оборудване, търговията на едро и дребно, ремонтните дейности, финансовите услуги, здравеопазването и др.
Центровете за данни са местата, където големите данни живеят. Те се генерират в интернет, но трябва да се съхраняват някъде и бизнесите имат различни подходи към това. Най-генеричният подход е – имате нужда да съхранявате данни, организирате си локален център, изграждате си съответните условия – непрекъсваемо електрозахранване, дизелови генератори, системи за климатизация, системи за пожарогасене, сигурност и т.н.
Другият подход е да се обърнете към такива като нас, които правят инсталации, събиращи стотици хиляди сървъри и шкафове за сървъри.
Разликата идва от икономията от мащаба. Когато ние го правим, го правим за голямо количество оборудване, докато една банка например би го направила за 30-40 шкафа за сървъри (това е количеството, нужно на финансовите институции у нас). Разликата в себестойността на един шкаф за нас и за тях е над три пъти – нашата е три пъти по-ниска от тяхната.
Освен това, след като се направи първоначалната инвестиция, има разходи и за поддръжка.
Нашият опит сочи, че всичко, което е под 100 шкафа като инвестиция, не е рентабилно. От тази гледна точка, всеки един бизнес, който решава да си прави нещата сам, трябва да знае, че проекти под този мащаб са нерентабилни и е много по-добре да използва услугите на външен доставчик като нас, защото ще получи на високо професионално ниво всички тези системи с гарантирана поддръжка.
Друг пример са мобилните оператори. За софтуера на една мобилна мрежа са нужни около 30 шкафа, т.е. няма много компании, които имат нужда от 100 шкафа. Това е и смисълът на съществуването на колокационни центрове – събирате всичко на едно място, правите свръхпрофесионално обслужване, поддръжка и системи и потребителите получават нещо, което трудно биха могли да направят сами от гледна точка на качествените характеристики, а от икономическа перспектива никога не биха постигнали рентабилност на тази си инвестиция.
Какви са изискванията към един доставчик на подобни услуги? С какво трябва да разполага той, за да бъде максимално полезен за клиентите си?
Според класификацията на видовете колокационните центрове има шест групи, като в последните две – 5 и 6, влизат единствено центровете на технологични гиганти като Meta и Google.
Когато има сървъри една компания и си ги поддържа сама, без да има специални изисквания, тя е индустриален потребител на елeктроенергия в общия случай и взима електрозахранване от една подстанция. Но ако стане авария, за да могат да продължат да работят сървърите, трябва да има UPS, който да поеме захранването, а през този интервал от време да се включи дизеловия генератор.
За да не е така, трябва да имате връзка към втора подстанция, както е изискването при болниците например.
Показателят за достъпност на услугата се разпределя в няколко категории – най-ниската е 99,7% на годишна база. При центровете за данни от тип 4 показателят е 99,995% - или средно по-малко от 26 минути на година някакви прекъсвания.
При категория 1 са над 28 часа на година, което е огромна разлика.
Този пример е същият и когато става дума за останалите системи, като климатизацията например.
В същото време, колкото по-висока е категорията, толкова по-високо е нивото на предоставяните услуги, но и на инвестицията. А, както стана ясно вече, тя може да бъде рентабилна само при достатъчно голям обем. И тъй като повечето бизнеси не могат да го осигурят, започват да правят компромиси с качеството и категорията.
По този начин вместо една банка например да има категория 4 колокационен център, тя има категория 2 локален център за данни и рискува над 20 часа спиране на услугите годишно или ако този център все пак е 4 категория то инвестицията е голяма и нерентабилна.
Как се развива пазарът на колокационни услуги в България? Осъзна ли българският бизнес стойността им?
До голяма степен – да, но и тук зависи от конкретната индустрия. ИКТ компаниите много бързо разбраха за какво става въпрос, защото самите те използват много интензивно данни. Здравеопазването и финансовите услуги също започват да разбират предимствата на колокационните услуги, както и производителите на автомобилни части например.
Иначе пазарът на колокационни услуги сам по себе си е от порядъка на 30 млн. евро приходи на годишна база, но ако включим и този на всякакви облачни услуги, достига над 600 млн. евро. За сравнение, пазарът на телекомуникационни услуги е над 1,5 млрд. евро.
Тоест, краткият отговор е – пазарът има още много да се развива. А това, че секторът е в развитие, означава, че ще има растеж. До момента виждаме ръст от около 17% на година, но от създаването си „Телепоинт“ например регистрира двойни на средните пазарни темпове.
В България съществуват 12 компании, които предоставят подобни услуги, и има изградени 22 центъра за данни с различни категории.
Тъй като това не е регулиран бизнес, компаниите нямат задължение да предоставят данни на администрацията, а оценката на пазарните дялове се прави косвено, на базата на декларираните от доставчиците данни за колокационната площ и количеството на осигуреното захранване. Статистиката поставя „Телепоинт“ на първо място, което е обяснимо, тъй като компанията е от първите на пазара, с около 1/3 пазарен дял.
Какво е бъдещето на големите данни и на „Телепоинт“ в частност?
Първата машинна ера, или по-известна като Индустриална революция, е мултиплицирала мускулните усилия на хората – ако преди е трябвало нещо да се произвежда с огромни физически усилия, след изобретяването на машините силата, която е употребявана в производството, не е само човешката.
С навлизането си компютрите и интернет мултиплицират менталните усилия на човека и процеса на измисляне се случва по-бързо и по-ефективно. Те дават и възможност за появата на големите данни – в момента за няколко часа в интернет се генерира повече информация, отколкото за цял човешки живот по времето на Шекспир.
С тях започва и втората машинна ера, а днес бизнесът може да избира между това да остане старомоден и това да влезе в икономиката на битовете, повишавайки конкурентоспособността си. Възникването на този тип икономика променя целия начин, по който функционира човешкото общество и цялата цивилизация. И тези, които не са в състояние да се адаптират, ще изчезнат по чисто еволюционни причини.
Така че големите данни освен че са хранителна среда за цифровата икономика, трансформират и начина, по който се прави бизнес. Вече един мениджър не може да е сигурен, че взима правилно решение, ако то не се базира на големи данни.
Що се касае до „Телепоинт“, без компании като нас големите данни можеше да ги няма в тези обеми. Ние продължаваме да инвестираме в колокационни центрове, но гледаме и в бъдещето.
В съхраняването и обработката на данни също има тенденции. Едната е да се използват централизирани локации. Другата е свързана с периферните изчисления, когато данните се обработват и съхраняват в хиляди крайни точки. Затова и ние водим разговори с няколко компании, които се занимават с обслужването на подобна инфраструктура.
Друго направление за развитие за нас е разширяването на предлагането на облачни услуги. Те са много популярни сред бизнеса, защото вместо една компания да инвестира в сървъри и дискове, купува облачна услуга, която предлага виртуализиран сървър, виртуализиран диск и т.н.
Увеличава се и търсенето на хибридни облачни услуги, които комбинират водещи облачни платформи като тези на Microsoft и Amazon с частна виртуална среда. Ние инсталираме съответното оборудване на клиента, виртуализираме го и той ползва виртуалната среда вместо да купува физическите машини.
С други думи казано, колокацията е базовата инфраструктура, върху която се опитваме да надграждаме с други услуги с висока добавена стойност.
Към днешна дата „Телепоинт“ разполага с три центъра за данни на територията на страната – два в София и един резервен в Монтана. Те са свързани на базата на високоскоростна DWDM мрежа, която разполага с капацитет 96 x 100 гигабита за пренос на данни от точка в точка.
Около „Телепоинт“ има изградена група партньорски компании, като идеята е около основния бизнес, свързан с колокационни и облачни услуги, да има други организации, които да допълват портфолиото. Целта е когато човек донесе оборудването си в колокационния център, да получи допълнителните услуги, от които има нужда – свързаност към интернет и други доставчици, защита срещу хакерски атаки и т.н. Да предлагаш колокационни услуги не е достатъчно. Стремим се да обхванем цялата екосистема.