AI kommer att förändra hur vi gör kemi: GPT-3-testet

EPFL-forskare har förfinat generativ AI och funnit att den fungerar bättre än modeller som är speciellt utbildade för vetenskap

EPFL-forskare förfinade GPT-3 och fann att det fungerar ännu bättre än modeller som är speciellt utbildade för kemisk forskning (Foto: EPFL/iStock)

L 'Artificiell intelligens det håller på att bli ett grundläggande verktyg i forskningen Chimica: utformningen av molekyler eller förutsägelsen av deras egenskaper kan anförtros till speciellt utbildade språkmodeller, och maskininlärning den har redan funnit sin plats i kemiska laboratorier.

Vad forskarna upptäckt Federal Polytechnic i Lausanne, har dock potentialen att helt revolutionera kemisk forskning: GPT-3, detta var den första titeln på studien som just publicerades på "Nature Machine Intelligence", det kan vara "allt du behöver för kemisk undersökning från begränsade datamängder".

Även om jag inte kan det mesta kemisk litteratur, versionen av GPT-3 perfektion av teamet på Berend Smith har bevisat att den kan konkurrera med traditionella och dyra tekniker automatisk inlärning, banbrytande för ett helt nytt tillvägagångssätt för kemi som kan förändra hur forskningen görs för alltid.

Generativ AI: "Det här är jobben som inte längre kommer att existera tack vare mig"
Den gröna kemins heliga gral: toxicitetsfria fluorkemikalier
GPT-3, algoritmen som skriver som en människa anländer till Italien

Kemi: GPT-3 kan förändra vårt sätt att forska — Grundläggande AI-modeller som GPT-3 kan förändra hur kemisk forskning görs för alltid: EPFL-studie (Foto: Envato)

Kemi i ord: GPT-3 AI-testet

L 'Artificiell intelligens har gått in i kemisk forskning sedan en tid tillbaka: denautomatisk inlärning, i synnerhet, har uppskattats mycket under åren för sin förmåga att fatta beslut baserat på data och att göra mycket exakta förutsägelser, som kan användas även för att skapa nya läkemedel.

Maskininlärning kräver dock stora mängder data att göra tillförlitliga förutsägelser, vilket inte är så självklart inom kemi: ofta räcker inte den tillgängliga data till för att algoritmerna ska kunna praktiseras, så effektiviteten av "märkt" eller övervakad maskininlärning är föremål för allvarliga begränsningar.

Alltså vissa forskareEPFL de tänkte på testa potentialen hos GPT-3, vid basen av den berömda ChatGPT-applikation: "Det faktum att grundmodeller kunde utföra uppgifter som de inte var explicit utbildade för”, läser vi i studien som just publicerades på 'Nature Machine Intelligence', "fick oss att undra om de också var kapabla att svara på vetenskapliga frågor som vi inte har ett svar på".

Eftersom i kemisk forskning de flesta av problemen kan vara uttryckt i ord, funderade forskarna på att träna dessa enorma modeller för att svara på några "kemist" frågor som är omöjliga att lösa utan att ta till komplicerade simuleringar och experiment (till exempel: "Om jag byter ut metallen i mitt metallorganiska ramverk, kommer det att vara stabilt i vatten?").

Artificiell intelligens och hologram: hälso- och sjukvårdens nya gräns
En "holotransport" integrerad med artificiell intelligens gör sin debut
SwissGPT: den schweiziska AI som revolutionerar företagssäkerhet

GPT-3 skulle kunna förenkla kemisk forskning — Att kunna förhöra en modell som GPT-3 innebär att man kan dra mycket bättre nytta av den kunskap som samlats in av forskare genom åren (Foto: Envato)

Kemi: en förbättrad GPT-3 för omöjliga svar

I motsats till vad en viss inledande skepsis kan antyda, ställer den metod som utvecklats av EPFL-forskare inte direkt frågor om GPT-3-kemi. "GPT-3 är inte bekant med den mesta kemiska litteraturen, så om vi ställer ChatGPT en kemisk fråga, är svaren i allmänhet begränsade till det som finns på Wikipedia", Han förklarar Kevin Maik Jablonka, huvudförfattare till studien.

"istället", förklarar Jablonka, "vi optimerad GPT-3 med en liten datamängd omvandlas till frågor och svar, och vi fick en ny modell som kan ge mycket exakt kemisk information".

Under den så kallade finjusteringen försåg forskarna GPT-3 med en kurerad lista över Frågor och svar: "Till exempel, för legeringar med hög entropi, är det viktigt att veta om en legering förekommer i en enda fas eller har flera faser", Förklarar han Berend Smith, professor i kemiteknik vid EPFL:s School of Basic Sciences.

Ett sådant problem, förklarar Smit, översätts till en sammanställd lista med frågor och svar som "D = 'Den Är det enfas? R= 'Ja/Nej'”.

"I litteraturen hittade vi flera legeringar för vilka svaret är känt, och vi använde dessa data för att utveckla GPT-3”, fortsätter Smit, ”det vi slutade med är en förfinad AI-modell som är utbildad för att endast svara på denna fråga ett ja eller ett nej".

Artificiell intelligens även för utveckling av nya läkemedel
Utveckling av nya läkemedel, förbättrade bibliotek tack vare kemi
Mot digital humanism: analys av en revolution med inlösen

GPT-3 kan specialisera och revolutionera kemin — En studie av Federal Polytechnic i Lausanne undersöker olika uppgifter: från klassificering (med tanke på den textuella representationen av en molekyl, ett material eller en reaktion) till regression (Foto: Jablonka, KM, Schwaller, P., Ortega-Guerrero, A. et al. Utnyttja stora språkmodeller för prediktiv kemi, Nat Mach Intell, 2024)

Grundläggande modeller som GPT-3 i forskarnas rutin

Den ”förbättrade” modellen, tränad med relativt få frågor och svar, löste sig korrekt mer än 95 procent av frågorna på mycket olika kemiska problem, ofta bättre än maskininlärningsmodeller som är speciellt programmerade för den uppgiften.

"Poängen är att det är lika enkelt som att göra en litteratursökning”, förklarar Smit, ”som dock fungerar med många kemiska problem". Dessutom är det tillvägagångssätt som utvecklats av Kevin Maik Jablonka utomordentligt snabbt och kräver inga specifika färdigheter, till skillnad från traditionella modeller maskininlärning.

Implikationerna av denna studie kan vara avgörande: möjligheten att formulera frågor som "Vad är utbytet av en [kemikalie] framställd med detta [recept]?” och ta emot en korrekt svar kan revolutionera hur kemisk forskning planeras och hanteras.

Som studien säger, "att kunna förhöra en grundläggande modell som GPT-3 kan bli en rutinmetod för att starta ett forskningsprojekt som utnyttjar den samlade kunskap som kodas i dessa grundläggande modeller eller för att tillhandahålla en baslinje för prediktiva aktiviteterOch".

"Det kommer att förändra hur vi gör kemi”, kommenterar professor Smit rakt ut.

Vatten, gräs och mänsklighet: de kognitiva gränserna för artificiell intelligens
Artificiell intelligens kommer att hjälpa oss att rensa haven från plast
Kemins 100 stora och utmaningarna i den globala ekonomin

Kemisk forskning med GPT-3: studien — I framtiden kanske vi kan fråga AI vad utbytet av en given kemisk produkt är med hjälp av ett visst recept, och det kommer att vara så enkelt som att göra en litteratursökning (Foto: Envato)

GPT-3 är "bara" ett verktyg: forskningen fortsätter

Resultaten av studien väcker en icke-sekundär fråga: hur är det möjligt att en naturlig språkmodell, utan någon specifik utbildning i kemi, kan vara mer exakt än specialprogrammerade modeller?

"Baserat på vår kunskap", läser vi i tidningen, "Det finns inget strikt svar på denna fråga".

Det faktum att mycket lovande resultat erhålls även med helt hypotetiska kemiska representationer visar att dessa grundläggande modeller är "mycket lämplig för att extrahera korrelationer från vilken text som helst".

Ma sökandet har precis börjat. Som forskarna förklarar, det faktum att GPT-3 identifierar korrelationer som framgångsrikt kan utnyttjas för att göra förutsägelser innebär inte att korrelationer alltid är signifikanta eller kopplat till orsak-verkan relationer.

För närvarande drar forskarna slutsatsen, GPT-3 "det är bara ett verktyg som tillåter oss att mer effektivt använda den kunskap som forskare har samlat in under åren".

Och igen: "Nästa steg blir att använda GPT-3 för att identifiera dessa samband och i slutändan få en djupare förståelse".

Här är hur AI revolutionerar köpbeteendet
Sökmotorernas utveckling: effekten av AI, Googles roll
Det är så AI-baserade system har dolda moraliska värderingar...

"Vad det betyder att vara en dator: GPT-3-intervju" (på engelska)

GPT-3 i kemisk forskning: nästa forskningssteg

Det faktum att GPT-3 identifierar korrelationer som framgångsrikt kan utnyttjas för att göra förutsägelser innebär inte att korrelationerna alltid är signifikanta eller kopplade till orsak-och-verkan-samband: forskningen har bara börjat (Foto: Envato)

AI kommer att förändra hur vi gör kemi: GPT-3-testet