Матей Захария, создатель Apache Spark и CTO Databricks
Матей Захария, создатель Apache Spark и CTO Databricks
Автор: Алексей Ветров [17.05.2026]

Создатель Apache Spark

В 2009 году, будучи аспирантом в AMPLab Калифорнийского университета в Беркли, Захария создал Apache Spark как более быструю альтернативу MapReduce. Фреймворк, написанный во время докторантуры, превратился в один из главных инструментов обработки больших данных на планете.

Румыния, Торонто и Ватерлоо

Матей Захария родился в Румынии и вырос преимущественно в Канаде. Окончил среднюю школу Jarvis Collegiate Institute в Торонто, затем поступил на бакалавриат в Университет Ватерлоо — по специальностям компьютерные науки и математика.

На соревнованиях International Collegiate Programming Contest (ICPC) в 2005 году его команда от Университета Ватерлоо заняла четвёртое место в мире и первое в Северной Америке — Захария стал золотым медалистом.

Ещё в студенческие годы он существенно доработал физику рендеринга воды в открытой игре 0 A.D. и участвовал в создании модов к Age of Mythology и Age of Empires III.

В 2007 году Захария получил серебряную медаль генерал-губернатора Канады за наивысшие академические результаты при выпуске с факультета компьютерных наук и математики Ватерлоо.

AMPLab UC Berkeley: Apache Spark и RDD

В 2007 году Захария начал докторантуру по информатике в UC Berkeley, работая в AMPLab под научным руководством Иона Стойки и Скотта Шенкера. Исследования были сосредоточены на отказоустойчивых распределённых вычислительных системах для обработки больших данных.

Apache Spark стал ответом на ограничения Hadoop MapReduce — прежде всего его неэффективность в итерационных алгоритмах, характерных для машинного обучения, где данные приходится перезагружать с диска на каждой итерации. Spark ввёл концепцию Resilient Distributed Datasets (RDD) — кэширование данных в оперативной памяти с поддержкой отказоустойчивости, что ускорило итерационные задачи в десятки раз по сравнению с Hadoop.

Формально Apache Spark был представлен в статье о RDD в 2012 году.

ACM Award и другие проекты

За исследования в области крупномасштабных вычислительных систем в 2014 году Захария получил ACM Doctoral Dissertation Award — престижнейшую премию за докторские диссертации в информатике. В 2019 году — Presidential Early Career Award for Scientists and Engineers.

Параллельно со Spark Захария участвовал в запуске Apache Mesos и Spark Streaming. В Databricks разработал MLflow — открытую платформу для управления жизненным циклом моделей машинного обучения, Delta Lake, а также участвовал в выпуске открытых LLM DBRX и Dolly. Также внёс вклад в создание Ray — фреймворка для масштабирования ИИ-приложений — и ColBERT, DSPy.

Databricks: сооснователь и CTO

В 2013 году Захария стал одним из сооснователей Databricks, где занимает пост технического директора.

MIT, Stanford и UC Berkeley

В 2015 году вошёл в преподавательский состав MIT, в 2016-м стал ассистент-профессором информатики в Стэнфордском университете. С 2023 года — доцент (associate professor) кафедры EECS в UC Berkeley.


Tags: #МатейЗахария #MateiZaharia #создательApacheSpark #DatabricksCTOсооснователь #UCBerkeleyассоциированныйпрофессор #ACMDoctoralDissertationAward2014 #MLflowDeltaLakeоткрытыйкод #RomanianbillionaireForbes #AMPLabBerkeleyраспределённыевыч

Дополнительные фотографии

Матей Захария, создатель Apache Spark и CTO Databricks

Матей Захария, создатель Apache Spark и CTO Databricks

Поделиться

Матей Захария

Матей Захария

Румынско-канадский учёный-программист, преподаватель и создатель Apache Spark

Родился: 21.04.1985 (41)

Последние новости

Люди Дня

Последние комментарии

Оставьте Комментарий

Имя должно быть от 2 до 50 символов
Введите корректный email
Заголовок должен быть от 3 до 200 символов
Сообщение должно быть от 15 до 6000 символов