Эта платформа является основой для работы с большими данными компании, на ней функционируют многие сервисы Яндекса, сообщается в пресс-релизе.
В компании работают над собственной экосистемой для больших данных с 2010 года, и спустя 13 лет она стала одним из ключевых элементов внутренней инфраструктуры Яндекса – каждый второй сотрудник компании работает с YTsaurus.
Платформа подойдет для разных задач. К примеру, Поиск Яндекса создает с ее помощью поисковый индекс, суперкомпьютеры компании управляются через YTsaurus, а беспилотные автомобили – обрабатывают на платформе данные о движении и улучшают свои алгоритмы.
Документация и исходный код YTsaurus опубликованы на GitHub. Код распространяется под лицензией Apache 2.0. В Яндексе предполагают, что доступ к YTsaurus особенно пригодится крупным организациям, которые обрабатывают огромные объемы данных на тысячах серверов в условиях постоянно возрастающей нагрузки.
Комментарии