Ahead of ChipEx2022: Bill Magro, CTO for HPC computing at Google and quantum physicist: AI training requires similar resources to a scientific project

For twenty years Magro was a user of supercomputers, a physicist who made models and ran them on some of the few supercomputers that existed at the time, then he moved on to develop the HPC at Intel and made the concept of powerful parallel computers more accessible and now, as mentioned, he promotes this technology further at Google where he Assists with artificial intelligence

Dr. Bill Magro, CTO for High Performance Computing at Google Cloud. Photo courtesy of him.
ד"ר ביל מגרו, CTO למיחשוב עתיר ביצועים בגוגל קלאוד. צילום באדיבותו

Bill Magro, CTO of high-performance computing at Google: The cloud can be used as a solution to the shortage of chips. Magro was for 20 years a physicist in the field of quantum physics who used supercomputers to run complex models, then for about twenty years at Intel where he promoted the development of the field of high-performance computing as a technological leader and for the last two years he is the CTO of the field of high-performance computing and the cloud at Google, which despite its position as a user it developed Chips that will accelerate the training of artificial intelligence systems and optimize YouTube video coding.

Q: Please tell us a little about yourself, your career and how the transition from academia to industry took place

"בזמן שעבדתי במחשוב בעל ביצועים גבוהים כל הקריירה שלי, ההכשרה הרשמית שלי היא כפיזיקאי קוונטי. בבית הספר לתארים מתקדמים, המחקר שלי כלל עריכת סימולציות מקבילות בקנה מידה גדול של מערכות חומר מרוכזות, והיה לי מזל שהיתה לי גישה לארבעת מרכזי מחשבי העל של ארצות הברית, במימון הקרן הלאומית למדע".

"ביצעתי את מחקר התואר השני שלי ב- NCSA באוניברסיטת אילינוי ואת עבודת הפוסט-דוקטורט שלי במרכז התיאורטי בקורנל (שניים מארבעת מרכזי הקרן הלאומית למדע של ארה"ב –  NSF). ההתנסויות הללו נתנו לי חשיפה למגוון רחב של ארכיטקטורות מערכת HPC ומודלים של תכנות יישומים, והחלטתי להמשיך את העניין שלי ב- HPC במקום להמשיך כחוקר פיזיקה."

"הצטרפתי לחברה קטנה המספקת כלי תוכנה ל-HPC, שנרכשה על ידי אינטל. באינטל, ביליתי כ -20 שנה בתפקיד מנהיגות טכנית, פיתוח וביצוע אסטרטגיות כדי להקים ולהצמיח את עסקי ה-HPC. תחומי העניין המרכזיים שלי היו HPC וענן  והחלטתי בשנת 2020 להצטרף לגוגל קלאוד כדי להמשיך את המשרה המלאה הזו."

Q: What made it possible for not only advanced users like you, but almost everyone to use high performance computing?

"בימים הראשונים של ה-HPC, מחשבי-על היו יקרים מאוד ונדרשה התמחות ארוכה לתפעל אותם. היה גם חסם פיננסי גבוה לרכישה ותפעול של מערכות אלה. קבלת הגישה הייתה קשה, ואלה שהייתה להם גישה היו צריכים לעתים קרובות להיות מומחים לא רק בשימוש אלא גם ביישומי הסימולציה ומודלים."

"דברים רבים השתנו והפכו את ה- HPC לנגיש יותר. ראשית, הופעתה של תוכנת HPC מסחרית מתוחכמת ונתמכת היטב הפחיתה את המורכבות הטכנית עבור משתמשים רבים, ואפשרה להם להתמקד בבעיות שהם רצו לפתור ולא ביישום הכלים עצמם. גורם חשוב נוסף היה העוצמה החישובית הגוברת של מערכות מבוססות מיקרו-מעבדים, שהובילו למעבר התעשייה לארכיטקטורות HPC מבוזרות או מקובצות.  המעבר לשרתי x86 סטנדרטיים בתעשייה התחזק ולינוקס התבגרה יותר, עלויות החומרה של מערכות HPC הופחתו באופן משמעותי."

"עם זאת, נותרו מספר חסמים, ובהם הצורך במומחיות בתכנון ותפעול מערכות, הצורך במתקני מרכזי נתונים והעלות הגבוהה של תשתיות לא מנוצלות. הופעתה של HPC מבוססת ענן מסייעת להתמודד עם האתגרים שנותרו, והופכת את HPC לנגיש יותר מתמיד למספר גדל והולך של משתמשים."

Q: What is unique about Google's HPC solution?

Like other cloud providers, Google Cloud can run most common workloads in HPC environments. What is different about Google's cloud is its commitment to an open, hybrid and multi-cloud future. We feel that hybrid HPC environments that combine on-premise and cloud resources are often the best choice for customers, and we adopt open technology standards to enable workload mobility – between on-premise environments, Google Cloud and even competing cloud provider environments.

We also feel our AI and analytics capabilities are best-in-class, and we help HPC users leverage these capabilities to accelerate their time to insights.

Finally, we like to see ourselves more as a partner than a supplier, bringing the best of Google to our engagements and not just products.

Q: Why does Google as an internet/software company engage in chip development?

We have multiple services, each with billions of users spread across the globe. To provide services on such a scale, we have become one of the world's largest consumers of commercial silicon.

However, we sometimes see opportunities to optimize the chips for very large scale use. Two good examples would be The video encoding chips ours, which provide very high-performance and power-efficient hardware acceleration for video encoding, and the Tensor processing units ours, which provide best-in-class performance and carrier efficiency for machine learning training.

That. How does Google see the importance of chips for the high-tech industry and how will the lack of chips be solved?

It is known that the demand for chips continues to rise, but disruptions in the supply chain are affecting production, leading to severe chip shortages. While it is clear that access to computing resources is critical for both industry and research institutions, it is not clear how and when the shortage will be resolved.

One thing we're seeing is that customers who normally buy on-premise systems are finding that they can get their task done months and sometimes a year earlier by accessing the Google Cloud infrastructure. The sheer scale of the cloud, combined with the shared access model, makes it an ideal way to mitigate, if not solve, some of these supply chain issues.

Q: What is the role of artificial intelligence in your field?

Artificial intelligence is an extremely important capability for Google, and we use it in a number of innovative ways, from improving our services to lowering the environmental footprint of our data centers.

In HPC, in particular, artificial intelligence is interesting in a number of ways. First, some AI workloads, such as deep learning training, benefit from or even require the same kinds of high-performance infrastructure as those used for engineering and scientific computing. In other words, some see deep learning training as an HPC workload, and deploy it in HPC environments.

Artificial intelligence is also changing a wide range of disciplines, bringing new capabilities and improved productivity to workers in a wide range of industries. Scientists and engineers who have been primary HPC users are also using AI as a way to increase their productivity and speed time to insight.

Finally, there is active interest around the world in ways to use artificial intelligence to directly speed up the simulation process, thus making a further contribution to shortening the time to reach conclusions. Google Research Team published Recently promising results on accelerating computational fluid dynamics simulations, which are common in areas such as product design, data center designs and weather forecasting.

To register for the ChipEx2022 conference

More of the topic in Hayadan:

Comments

  1. High Performance Computing - high performance computing. There is no point in calling it a supercomputer - that is reserved for the most powerful computers in the world of this type because there are a lot of them.

  2. לא ספרתי כמה פעמים מופיע הביטוי "HPC" – אבל מה שכן מופיע 0 הסבר מה משמעות ראשי התיבות. לימוד אותי כבר בשנה א לימודי הנדסה לכתוב מה פרוש כל אות וראשי תיבות. לאידייותות כמוני המומחים בתחומים אחרים אך רוצים להבין ההתפתחויות בעולם, הכתבה הזו לא סיפקה לי כלום.

Leave a Reply

Email will not be published. Required fields are marked *

This site uses Akismat to prevent spam messages. Click here to learn how your response data is processed.