PaLM 2

PaLM (Pathways Language Model) — Google AI tərəfindən hazırlanmış 540 milyard parametrli transformator əsaslı böyük dil modeli.[1] Tədqiqatçılar həmçinin model miqyasının təsirlərini yoxlamaq üçün PaLM-in daha kiçik versiyalarını, 8 və 62 milyard parametrli modellərini yaradıblar.[2]

PaLM
Loqonun şəkli
Tipi böyük dil modeli
Tərtibatçı Google AI
Sayt ai.google/discover/palm2/
Vikianbarın loqosu Vikianbarda əlaqəli mediafayllar

PaLM, sağlam düşüncə, arifmetik əsaslandırma, zarafat izahı, kod yaratmaq və tərcümə də daxil olmaqla, geniş spektrli tapşırıqları yerinə yetirməyə qadirdir.[2][3][4][5] Düşüncə zənciri ilə birləşdirildikdə, PaLM söz problemləri və məntiqə əsaslanan suallar kimi çoxsaylı addımların əsaslandırılmasını tələb edən verilənlər bazasında əhəmiyyətli dərəcədə yaxşı performans əldə edib.[1][2]

Model ilk dəfə 2022-ci ilin aprelində elan edildi və Google PaLM və bir sıra digər texnologiyalar üçün API təqdim edənə qədər 2023-cü ilin martına qədər gizli qaldı.[6] API ictimaiyyətə təqdim edilməzdən əvvəl gözləmə siyahısına qoşulmuş məhdud sayda tərtibatçılar üçün əlçatan idi.[7]

Google və DeepMind PaLM 540B-nin Med-PaLM adlı tibbi məlumatlar əsasında dəqiq tənzimlənmiş və tibbi sual-cavab meyarları üzrə əvvəlki modelləri üstələyən versiyasını hazırlayıblar.[8][9] Med-PaLM ABŞ tibbi lisenziyalaşdırma sualları üzrə keçid balını keçən ilk şirkət olub və həm qapalı, həm də açıq suallara dəqiq cavab verməklə yanaşı, həm də əsaslandırma təqdim edir və cavablarını qiymətləndirə bilir.[10]

Google həmçinin robot manipulyasiyası üçün istifadə edilə bilən ən müasir görmə dili modeli olan PaLM-E yaratmaq üçün görmə transformatorundan istifadə edərək PaLM-i genişləndirib.[11][12] Model robototexnika sahəsindəki tapşırıqları təkrar təlimə və ya incə sazlamaya ehtiyac olmadan rəqabətli şəkildə yerinə yetirə bilər.[13]

2023-cü ilin may ayında Google hər il keçirilən Google I/O tədbirində PaLM 2-ni elan etdi.[14] PaLM 2-nin 3,6 trilyon token üzərində öyrədilmiş 340 milyard parametr modeli olduğu bildirilir.[15]

2023-cü ilin iyun ayında Google, PaLM-2 arxitekturası və işə salınmasından istifadə edən nitqdən nitqə tərcümə üçün yaradılan AudioPaLM-i elan etdi.[16]

PaLM müxtəlif təbii dil tapşırıqlarını və istifadə hallarını özündə birləşdirən 780 milyard tokendən ibarət yüksək keyfiyyətli korpusda əvvəlcədən hazırlanmışdır. Bu verilənlər bazasına filtrdən keçmiş veb səhifələr, kitablar, Vikipediya məqalələri, xəbər məqalələri, GitHub-dakı açıq mənbəli repozitoriyalardan əldə edilmiş mənbə kodu və sosial media söhbətləri daxildir.[1][2] O, Google-un LaMDA modelini öyrətmək üçün istifadə olunan verilənlər bazasına əsaslanır.[2] Məlumat dəstinin sosial media söhbət hissəsi korpusun 50%-ni təşkil edir ki, bu da modelin dialoq qabiliyyətinə kömək edir.[2]

PaLM 540B, bu günə qədər təsvir edilən ən böyük TPU konfiqurasiyası olan model və məlumat paralelliyi kombinasiyasından istifadə etməklə birləşdirilən 768 hosta qoşulmuş hər Podda 3,072 TPU v4 çipi olan iki TPU v4 Pod üzərində öyrədilmişdir.[2][17] Bu, 6,144 çipdən istifadə edərək, miqyasda səmərəli öyrənməyə imkan verdi və bu miqyasda LLM-lər üçün əldə edilən ən yüksək öyrənmə səmərəliliyi rekordunu (cihazın FLOPS istifadəsi 57,8%) qırdı.[3]

  1. 1 2 3 Narang, Sharan; Chowdhery, Aakanksha. "Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance". ai.googleblog.com (ingilis). 4 April 2022 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  2. 1 2 3 4 5 6 7 Chowdhery, Aakanksha; Narang, Sharan; Devlin, Jacob; və b. "PaLM: Scaling Language Modeling with Pathways". 2022. arXiv:2204.02311 [cs.CL].
  3. 1 2 Anadiotis, George. "Google sets the bar for AI language models with PaLM". VentureBeat. 12 April 2022. 21 September 2022 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  4. Bastian, Matthias. "Google PaLM: Giant language AI can explain jokes". THE DECODER. 5 April 2022. 19 October 2022 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  5. "Google: Why Is No One Talking About PaLM (NASDAQ:GOOG) | Seeking Alpha". seekingalpha.com (ingilis). 12 December 2022. 12 December 2022 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  6. Vincent, James. "Google opens up its AI language model PaLM to challenge OpenAI and GPT-3". The Verge. 14 March 2023. 14 March 2023 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  7. Huffman, Scott; Woodward, Josh. "PaLM API & MakerSuite: an approachable way to start prototyping and building generative AI applications" (ingilis). 14 March 2023 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  8. Singhal, Karan; Azizi, Shekoofeh; Tu, Tao; və b. "Large Language Models Encode Clinical Knowledge". 2022. arXiv:2212.13138 [cs.CL].
  9. "MedPaLM: New Chatbots Will Soon Be Better Than Waiting For A Doctor". The Medical Futurist. 17 January 2023. 17 January 2023 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  10. Matias, Yossi; Corrado, Greg. "Our latest health AI research updates". Google (ingilis). 14 March 2023. 14 March 2023 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  11. Driess, Danny; Xia, Fei; Sajjadi, Mehdi S. M.; və b. "PaLM-E: An Embodied Multimodal Language Model". 2023. arXiv:2303.03378 [cs.LG].
  12. Driess, Danny; Florence, Pete. "PaLM-E: An embodied multimodal language model". ai.googleblog.com (ingilis). 10 March 2023 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  13. Edwards, Benj. "Google's PaLM-E is a generalist robot brain that takes commands". Ars Technica (ingilis). 7 March 2023. 7 March 2023 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.
  14. Lardinois, Frederic. "Google launches PaLM 2, its next-gen large language model". TechCrunch. May 10, 2023. May 10, 2023 tarixində arxivləşdirilib. İstifadə tarixi: May 10, 2023.
  15. Elias, Jennifer. "Google's newest A.I. model uses nearly five times more text data for training than its predecessor". CNBC. 16 May 2023. 16 May 2023 tarixində arxivləşdirilib. İstifadə tarixi: 18 May 2023.
  16. "AudioPaLM". google-research.github.io. 2023-06-29 tarixində arxivləşdirilib. İstifadə tarixi: 2023-06-30.
  17. "An empirical analysis of compute-optimal large language model training". www.deepmind.com (ingilis). 13 April 2022 tarixində arxivləşdirilib. İstifadə tarixi: 17 March 2023.