<
יום שבת , דצמבר 16 2017
מבזקים
דף הבית > חומרות > מערכות הספק, קירור ואל פסק > DCIM: תוכנת הניהול האינטגרטיבית לתשתיות Data Center

DCIM: תוכנת הניהול האינטגרטיבית לתשתיות Data Center

רוני עוזרי וברוך קוור, מיסדים-שותפים של TriTech

רוני עוזרי וברוך קוור, מיסדים-שותפים של TriTech

בעידן שהמתכננים נדרשים לספק הרבה יותר (עוצמה חישובית, הלימה עסקית, זמינות ונגישות) תמורת הרבה פחות (פחות שטח רצפה, פחות חשמל, פחות "עקבות פחמן" באטמוספרה ופחות שעות אדם בתחזוקה), אי אפשר להשאיר את תכנון ה-Datacenter בעולם של אתמול. יישום חכם של מערכות ניהול ייעודיות לנושא התכנון יכול להיות ההבדל בין הצלחה מהדהדת לכישלון צורב. אל תסתפקו בפחות מהטובים ביותר.

האלגוריה הישנה הזאת מוכרת לכולם – אך הבנאליות לא גורעת מהאמת שהיא ממחישה גם כשמדובר בתחום אולטרה מודרני כמו תכנון מרכזי מחשבים (Data Center) ואף לא מהרלוונטיות שלה להתמודדות עם אתגרי הווירטואליזציה והענן. אנו מדברים על הסיפור אודות 4 עיוורים שהתבקשו לחקור מה זה פיל, במישוש כמובן, ולדווח מה מאפיין את החיה הזאת. כל אחד תקף את הנושא מזווית אחרת וכך התקבל בליל לא קוהרנטי של התרשמויות. "רגליים ענקיות מכוסות בעור עבה", "זרבובית ארוכה ושרירית שמסתיימת בנחיריים לחים", "קרניים מוזרות, חלקות ומקושתות, שיוצאות מהפה" ו"אוזניים רבועות, גמישות ומתנפנפות ברוח". אך למרות השעות הארוכות שהעיוורים ישבו יחד בניסיון ליצור סינתזה הגיונית של הפרטים, תמונה של פיל לא יצאה מהפרויקט.

להבין את ה-Data Center כמכלול

כך גם קרה לוועדת בינוי שיצאה להתרשם מ-Data Center לדוגמה לפני פרסום מכרז להקמת מרכז מחשבים חדש עבור חברה ידועה. הארכיטקט התרשם שזה בסך הכל מרתף נטול חלונות, מאוכלס בצפיפות בארונות שחורים על רצפה בהירה, כמו לוח שחמט לגוליברים. החשמלאי התלהב מהיציבות של אספקת הזרם וההגנות מפני הפסקות חשמל, איש מיזוג האוויר חשב למנוע יצירת אזורים קרים מדי לצד ריכוזי חום (Hot Spots)  בתוך אותו חלל עצמו, ומנהל מערכות המידע הודאג מכך שעליו להכניס כפליים שרתים בחדר שגודלו פחות מחצי שטח ה-Data Center הישן, שגם הוא צפוף מדי. בישיבת ההתנעה של הפרויקט, בניצוחו של המנכ"ל החדש והנמרץ, הם לא הצליחו להגיע לקונצנזוס בשום נושא. די מהר התברר שקיימות סתירות פנימיות בין מה שכל אחד חשב כחיוני או קריטי לבין מה שהאחרים חשבו. לכולם היה ברור שצריך מנגנון אופטימיזציה רב משתנים, אינטרדיסציפלינרי, שייקח בחשבון את המגבלות התקציביות הן של פרויקט ההקמה והן של עלויות התחזוקה השוטפת. אבל לאף אחד לא היה מושג איך להתקדם בכיוון זה. ואז הציע סמנכ"ל הכספים להזמין מומחה חיצוני, בתקווה שההמלצות לא יגיעו לסכומים האסטרונומיים שנדרשו עבור סיפוק כל דרישות חברי הוועדה.

"כשהגענו לאתר ה- Data Centerהישן התגלה לעיננו מחזה שכמוהו ראיתי לא פעם בשנים האחרונות", מספר רוני עוזרי, מנכ"ל ומייסד-שותף בחברת Tri-Tech המתמחה בהקמת מרכזי מחשבים חדישים ויעילים אנרגטית. "למעלה מ-500 שרתים מילאו את האולם רחב הידיים ולפחות תריסר טכנאים היו עסוקים בחיווט מחדש והזזת שרתים מארון אחד למשנהו. המנמ"ר הסביר לי שהשינויים נדרשים כדי לאזן את העומסים על מערכות החשמל וקירור. החברה היתה בשיאו של מהלך וירטואליזציה, במטרה להיפטר ממרבית השרתים הפיזיים שמילאו את ה-Data Center עד אפס מקום. אך לאחר שהשרתים הישנים הוצאו מה-Data Center ובמקום הותקנו שרתי להב (Blade Servers) חדשים, התברר כי מפת פיזור החום במתקן השתנתה לחלוטין. השרתים, והחום שהם מפיצים, התרכזו במספר קטן יחסית של ארונות – בסך הכול פחות אנרגיה, אך לא פחות בעיות קירור. בכל ארון נוצר הרבה יותר חום ונשאר פחות מקום למעבר אוויר קר מהסביבה. "הפתרון ל-Hot Spots אינו על ידי פיזור מחדש של השרתים," הסברתי למנמ"ר המיואש, שחש כמי שנלכד בסינדרום סיזפוס. "הבעיות הנקודתיות הן סימפטומים בלבד למחלה בסיסית יותר, חוסר היעילות של שיטת הקירור המיושנת שלכם. נצטרך לעבוד על פתרון בסיסי בראייה הוליסטית של ה-Data Center. נטפל בבעיות השורש והבעיות הנקודתיות ייעלמו מעצמן."

אנטומיה של בזבוז אנרגיה

"המנמ"ר היה סקפטי, לכן הלכנו למשרד שלו במטרה לאחזר כמה נתונים מספריים שאולי ישכנעו אותו", אומר ברוך קוור, מנהל הטכנולוגיות ומייסד-שותף של Tri-Tech. "עבודת ההכנה לפרויקט הווירטואליזציה סיפקה לנו כמה נתונים קריטיים. 500 השרתים שמילאו את ה-Data Center, באם הם היו נדרשים לעבוד כולם בשיא ההספק, צורכים למעלה מ-400 קילוואט. בפועל, הניצול הוא רק בסביבות 25%, כלומר רק כ-100 קילוואט נצרכים בממוצע, עם שיאים קצרים של עד 180 קילוואט. מערכת הקירור נבנתה להתמודד עם פיזור חום של 250 קילוואט, כך שרק לעיתים נדירות יש מחסור אבסולוטי בכושר קירור. אבל העומסים האלה נודדים מארון לארון בתוך האולם, על פי השינויים בתמהיל הריצות, ועובדה זו לא נלקחה בחשבון בזמן ההתקנה המקורית. לכן התעורר הצורך שראיתי, בפיזור מחדש של השרתים בין הארונות, כאשר הווירטואליזציה עברה סף מסוים. עכשיו רק כשליש השרתים ממשיכים לעבוד – השאר נמצאים בדרך לפח המיחזור – ואלה שנשארו עובדים הרבה יותר אינטנסיבית.

"אך לא די במיקום מחדש של יחידות הקירור, כפי שקיווה המנמ"ר. מאחר וזו מערכת קירור די מיושנת, היא פועלת כל הזמן בהספק המרבי, כלומר מתאמצת לסלק 250 קילוואט חום מהאזור בו, בממוצע רק 100 קילוואט חשמל הופכים לאוויר חם. וחמור עוד יותר, הנצילות  הכוללת של הקירור היתה נמוכה מאוד. את זה למדנו מעיון בחשבונות החשמל. מתקן הקירור צרך בממוצע 160 קילוואט, 8,760 שעות בשנה, ובסך הכל 1.42 מיליון קילוואט-שעה בשנה! 'זה לא בתקציב שלי' התגונן המנמ"ר אחרי שהסברתי לו כי בתכנון אנרגטי נכון אפשר לחסוך כ-350,000 שקל בשנה. 'צריכת החשמל היא בתקציב ניהול הנכסים – והחכמים במחלקת התחזוקה לא מוכנים לזרוק מכונה שעדיין עובדת, גם לא עשרים שנה אחרי שהיא גמרה את תקופת האמורטיזציה שלה.

ה-Data Center הוא מכונת העסקים החדשה

"המנכ"ל דווקא כן הבין את הכדאיות של שינוי רדיקלי, שיביא לחיסכון מהותי שנה אחר שנה", ממשיך רוני עוזרי את הסיפור. "אלא, שכלמוד ניסיון, הוא רצה להשיג עוד כמה מטרות ארוכות טווח: 'חייבים להקטין את מספר העובדים בתחזוקה', הוא אמר כשהוא נועץ את עיניו במנמ"ר. 'לא ייתכן שיותר מ-80 אחוז מהתקציב שלך מבוזבזים על שמירת הקיים ולא נשאר דבר לפיתוח יכולות חדשות. נתתי לכם אור ירוק לפרויקט של התחדשות ה-IT משום שזה הנדבך עליו יקום הארגון החדש של החברה. במאה ה-21 ה-IT לא יהיה תקורה ניהולית, הוצאה שחובה לקצץ בה, אלא מכונת העסקים המרכזית שלנו. כבר היום אי אפשר לבצע אף פעולה עסקית ללא תמיכה צמודה של ה-IT – והתלות הזאת הולכת וגדלה ככל שהאינטרנט תופס מקום מרכזי יותר בשיווק, במכירות, בתפעול הלוגיסטי ובשרשרת האספקה שלנו. ואם ה-IT הוא ריצפת היצור של ערך המידע, נטפל בו במתודות של הנדסת יצור.. ההנהלה הזאת דורשת מקצוענות בכל פרט, החל בהורדת עלויות בעלות כוללות וכלה בסידורי האבטחה הפיזית. אני לא רוצה לשמוע בעוד שנה שלא חשבתם על משהו וצריך תקציב נוסף לשדרוגים".

המנמ"ר הרגיע את המנכ"ל, והסביר לו שזו בדיוק הסיבה מדוע הוא זקוק לסיוע מחברה שהתמחתה ביישום פתרונות DCIM. "הייחוד שלנו נובע מהניסיון בתוכנת Data Center Infrastructure Management (DCIM), שהיא סביבת עבודה ממוחשבת לתכנון וניהול מרכזי מחשבים", הסביר רוני עוזרי. "כפי ש-CAD נועדה לתכנון מכני ו-CAE משמשת להנדסת אלקטרוניקה. התוכנה המובילה בתחום הזה היא Struxure Ware, מוצר פורץ דרך של חברת APC מקבוצת Schneider Electric. התוכנה הזאת מסלקת את ההסתמכות על אינטואיציה ותחושות בטן מתכנון וניהול מרכז המחשבים ומחליפה אותה במתודה הנדסית מדויקת.

סביבת הפיתוח משמשת גם לניהול שוטף

"עם זאת, תוכנת DCIM אינה "קופסה שחורה" שאתם מכניסים לתוכה נתונים מסוימים והיא שולפת תכנון אופטימלי Deus Ex Machina. היא עוזרת למי שיודע מה נדרש מהתכנון ובאיזה מתווה קיים סיכוי טוב להגיע לתוצאה אופטימלית. זו בעצם סביבת פיתוח אינטראקטיבית שעוזרת למתכנן לראות על המסך סימולציה של תוצאות כל החלטה שהוא שוקל. כיצד כל שינוי תצורה ישפיע על צריכת החשמל והקירור – בתוך השרת הספציפי, בארון ובחדר השרתים כולו. היא מדריכה את המתכנן בבחירת הרכיבים האופטימליים לזיווד, לאספקת זרם חשמלי, למיקום יחידות המיזוג, ולטופולוגית תשתית תקשורת עמידה בתקלות (Network Critical Physical Infrastructure). היא מאפשרת לבחון מצבים חריגים, שיאי צריכה וכשלים של תת-מערכות, ולוודא שרזרבות הזרם מאפשרות התמודדות איתם על ידי העברה חלקה של עומסים לשרתים פנויים".

"מערכת Struxure Ware מאחדת את הגישה ההנדסית לכל 4 הדיסציפלינות הלוקחות חלק בעיצוב Data Center מתקדם: ניהול הספק, ניהול תרמי, זיווד מכני וניטור תפעולי. ניהול ההספק מבטיח שכל ארון יקבל את מלוא דרישות החשמל שלו – בלי לבזבז הספק על שרתים שנמצאים בבטלה יחסית. הניהול התרמי עוקב אחרי הטמפרטורה בכל נקודה קריטית – ויש רבות בכל ארון ציוד – ומכוונן את זרם האוויר הקר למקומות בהם הוא נדרש באמצעות שליטה ביחידות מזוג. הזיווד המכני הוא זה שמאפשר צפיפות גבוהה של שרתים בלי להפריע לתחזוקה קלה. והניטור התפעולי מספק Dashboard מנהלים עליו מוצגים בזמן אמת כל הנתונים הדרושים לניהול אינטגרטיבי. מנהל המשמרת מקבל מיפוי תלת-ממדי של הטמפרטורה ב-Data Center, "שעונים" שמראים את צריכת החשמל בכל שרת ואת רזרבות הקירור בכל מעגל מי קירור, "רמזורים" שמתריעים על מצבי כשל (אדום) וסכנה (צהוב), וגרפים שמלמדים איך מנוצלים משאבי ה-IT בכל רגע נתון. התוכנה מאפשרת גם לראות מה יקרה אם נוסיף עוד משימות עיבוד נתונים, אם נכבה אחד ממצנני המים לצורך תחזוקה, או שאחד מספקי UPS יצא משימוש. הודות לסימולציה של מצבים היפותטיים יכול מנהל המערכת לבחור את הפעולה הנכונה בכל מצב בו נדרשת התערבות אנושית".

שינוי סדר הקדימות ביעדי התכנון

"הצורך בתוכנה לתכנון אופטימלי של ה-Data Center אינו חדש", אומר ברוך קוור. "הוא רק נעשה קריטי יותר ויותר מיום ליום. כשה-Mainframe היה יקר והחשמל זול, מנהלים היו מוטרדים יותר מהרושם הוויזואלי שיצר ה-Data Center על המבקרים במשרדי החברה. הארכיטקטים בנו את מרכז המחשבים כהיכל במקום שכולם יראו את עוצמת המחשוב של הארגון – והציבו את מתקני הקירור וספקי הזרם רחוק מהעין – ולא תמיד במיקום אופטימלי מבחינה אנרגטית. היום המצב שונה. ארונות השרתים נדחקים למרתף כדי למזער עלויות נדל"ן ולשפר את ההגנה הפיזית על ליבת המחשוב הארגונית, ויחידות הקירור נכנסות בין ובתוך הארונות, כדי למזער אובדן אנרגיה. ומצד שני, התלות של הארגונים בליבה הזאת נעשתה קריטית ביותר. בהרבה חברות, במיוחד כאלה  שמספקות שירותי תקשורת ואינטרנט, השבתת הליבה עלולה לעלות עשרות אלפי דולר לדקה!

"היום השיקולים ההנדסיים מכריעים את הכף, ואלה נעשו מורכבים מדי עבור הגישה המסורתית "ננסה ונתקן", Trial & Error. יש צורך במתודה הנדסית מוצקה, במערכת תוכנה הבנויה להתמודד באיזון עשרות הפרמטרים שדורשים Trade-Off מדוקדק – ובגורמים באירגון שיודעים איך ליישם אותה. אנו מבצעים פרויקטים מוכללים, Turnkey, וכשנדרש לוקחים אחריות על כל חלקי האינטגרציה – ארכיטקטורה, הנדסה אזרחית, בינוי, חשמל, קירור, תקשורת וכדומה. אבל הייחוד שלנו הוא ביישום מערכת ניהול DCIM, באינטגרציה חכמה. ההתמחות של Tri-Tech בתוכנת Struxure Ware מובילה את השוק. הפער הולך וגדל ככל שהמחשב ממלא תפקיד מרכזי יותר בתכנון. התרבות הארגונית שלנו, שמעדיפה איכות על כמות, מטמיעה גישה יצירתית לטכנולוגיה העדכנית ביותר בכל פרויקט שאנו עושים".

כך רוכשים מוניטין בענף ה-Data Center

משיחה עם אייל עזרן, מנהל תשתיות בחברת Better Place, התברר לנו יותר מה עושה את TriTech לספקית מועדפת על לקוחותיה. "ב-3 השנים האחרונות תרי-טק תשתיות הייתה עבורנו – ועודה – יותר מספק שירותים מקצועיים", אומר אייל עזרן. "מצאנו בה שותף מקצועי בתכנון וקבלן ביצוע אמין לפרויקט תשתיות ה-IT במטה החברה בראש העין. המעורבות האישית והאחריות הלא מסויגת של כל עובדי החברה, כולל מנהליה הבכירים ביותר, הביאו אותנו פעם אחר פעם לבחור להשתמש בשירותיה. ולא מדובר רק במומחיות טכנית וניסיון יישומי. אני יודע שבמקרה של בעיה, אני יכול ללכת לישון בביטחון מלא, שהם לא ילכו לישון עד שהבעיה תיפטר".  מצד שני, מוסיף רוני עוזרי, "לא הפכנו להיות קבלן התקנות, לעבודות כאלה אנו מפעילים את קבלני הבית כאשר, כמובן, האחריות הכוללת הינה של תרי-טק. אנו חברה צעירה עם מנגנון דינמי שגדל וקטן ביחס ישיר להיקף הפרויקטים שהתחייבנו לבצע בזמן נתון."

"ההבנה, שתכנון Data Center הוא מקצוע הי-טק לכל דבר, מגיעה לישראל באיחור", אומר ברוך קוור. "נדרשו שנים כדי להשריש בתעשייה זו את עולם המושגים של TCO, עלויות בעלות כוללות, שמחייב התייחסות כמותית-כלכלית מדויקת לכל הוצאה במהלך חיי המוצר. אנחנו ב-Tri-Tech חיים בעולם הזה שנים לפני שהוא הפך לשיחת היום בארגונים העולמיים הגדולים, כי בעצמנו ניסינו לפתח פתרון DCIM מקורי. כאשר הגיעה Struxure Ware הבנו שאין לסטארט אפ ישראלי סיכוי לנצח אותה. If You Can’t Beat Them, Join Them, אומר פתגם ידוע, אז, במקום לקפל את האוהל, החלטנו להתמחות ביישום הפתרון הזה בישראל. היום יש לנו יותר "שעות Struxure Ware" מלכל המתחרים גם יחד.

אודות יהודה אלידע

עורך ראשי. במהלך חצי יובל השנים האחרונות ביסס יהודה אלידע את מעמדו המוביל בין העורכים והפרשנים של טכנולוגיות מידע בישראל, הודות לרקע מדעי (MSc בפיזיקה ממכון ויצמן), ניסיון ניהולי (15 שנה בשיווק וניהול חברות בישראל ובחו"ל), גישה אנליטית ומחויבות לעיתונאות אחראית. יהודה אלידע ייסד, ניהל וערך את המהדורה הישראלית של PC Magazine ואת NET Magazine וב-12 השנים האחרונות הוא העורך הראשי של IT מגזין, מוסף המחשבים של גלובס, בנוסף לאחריותו על התכנים המקצועיים של פורטל IT News.

להשאיר תגובה

נגישות