"John Wilkes says that joining Google was like swallowing the red pill in The Matrix. Four years ago, Wilkes knew Google only from the outside. He was among the millions whose daily lives so deeply depend on things like Google Search and Gmail and Google Maps. But then he joined the engineering team at the very heart of Google’s online empire, the team of big thinkers who design the fundamental hardware and software systems that drive each and every one of the company’s web services." - × × ×
“Charles Reiss — a Berkeley graduate student who interned at Google under John Wilkes and has seen Borg in action — doesn’t believe this existing system offers an enormous advantage over the alternatives. “I don’t think it’s super impressive — beyond having just tons of engineering hours poured into it,” he says. But Omega, he adds, is another matter. ¶
With Omega, Google aims to make the process ever smoother — much like Twitter has done with Mesos and Aurora — and in the long term, others will surely follow their lead. Google and Twitter treat the data center like one big computer, and eventually, that’s where the world will end up. This is the way computer science always progresses. We start with an interface that’s complicated and we move to one that’s not. It happens on desktops and laptops and servers. And now, it’s happening with data centers too.” - × × ×
/* from inside g.: not that Borg is simple, far from it. but it's interface is well within the mental grasp of one person. this seems to be the important threshold. */ - 9000
Все тексты об устройстве Твиттера внутри вызывают стойкое ощущение глубокого оверинжиниринга. У них задача-то в 100 раз проще гугловой. - alex@kapranoff.ru
^ нет. инфраструктурно они не проще. а о хитроумии поисковых алгоритомов гугла, которые живут поверх инфраструктуры, вообще нигде речи не заходило. - 9000
у задач нет инфраструктуры, она появляется только у решений. решения у них кажется действительно не проще. об этом я и говорю. - alex@kapranoff.ru
Ну, с подходом "сделаем быстренько на руби" они наигрались и осознали свою неправоту. А ещё твиттер хочет деньги делать, соотв. на чём-то желал бы аналитику гонять. Также был бы благодарен за примеры overenginering-а в тваттере и идей по упрощению. - 9000
Ну да, согласен. У них сейчас вторая версия по Бруксу во всей красе :) Upd: наверное. Всё-таки ни с кем изнутри Твиттера я никогда не общался. - alex@kapranoff.ru
признаюсь, что с конкретными примерами у меня сложно. порылся чуть-чуть в старых новостях, но тщетно. если брать конкретный Mesos, то на масштабах Твиттера (пара ДЦ и пара сотен программистов) экономия от того, что на бэкендах БД, где простаивал процессор, начнут гонять ещё хадуповские считалки, не должна быть выше чем потери от резко возрастающей взаимозависимости компонент и смены большого числа внутренних программных интерфейсов. - alex@kapranoff.ru
условный внутренний AWS построить и проще чем внутренний AppEngine, и он сразу готов к более универсальным задачам. но конечно спички сами себя в этом случае не сэкономят, и хороших, работящих админов нанимать нужно будет больше :) - alex@kapranoff.ru
с другой стороны, условный AWS требует на порядок больше возни со стороны человеков-девелоперов и человеков-SRE, со всей этой ручной аллокацией ресурсов, failover-ом при неизбежной внезапной смерти инстансов, размышлениями о распределении по DC и прочим; это я целый год наблюдал вблизи. условный AppEngine с borg-ом внутри это автоматизирует. - 9000