
Pilt: NIST, Structural Databases
Sotsiaalmeedia on laienenud ja haaramas ebatõenäolist sihtmärki – molekule.
USA instituudi (National Institute of Standards and Technology – NIST)
teadlased on loonud molekulaarsete andmete võrgustiku, mis on sarnane
Facebook’i graafilisele otsingule (graph search). Kui graafiline otsing
võimaldab kasutajatel leida kõik mingis linnas elavad, õlut joovad semud ühe
kiire otsinguga, siis NISTi loodud võrgustikud võivad aidata teadlastel
kiiresti läbi sõeluda määratu hulga keemilisi ja bioloogilisi andmeid, et leida
spetsiifiliste omadustega aineid. Selline otsingusüsteem võimaldab kiirendada
uute ravimite ja materjalide väljatöötamist.
NISTi meeskond esitles oma tööd “Challenges andSolutions for Enabling Facebook like Graph-search on Small and Macro-molecularStructural Data” juuli lõpus toimunud American Crystallographic
Association’i kohtumisel.
Õigete sõnade valimine
Molekulidel ei ole oma online profiili, nii et peamine väljakutse NISTi
uurijate jaoks oli standardse keele välja arendamine oma uurimisaluste
objektide kirjeldamiseks, kuna üks uurimisgrupp võib kirjeldada materjali
omadust ühe, teine aga teise sõnaga, kuigi need on sama tähendusega.
Üheks probleemi lahendamise võimaluseks oleks määratleda teatud standardsed
sõnad, kuid NISTi teadlased kasutasid paindlikumat lähenemist, mis võib ajas
areneda. NISTi keemiku Talapady Bhat’i sõnul, kes on juhtinud sõnavara
andmebaasi väljatöötamist, sarnaneb välja- töötatud otsingukeel indo-euroopa
keeltega nagu sanskriti ja ladina keel, mis kasutavad lühikest tüve, millest
teatud reeglite põhjal moodustatakse sõnu. Ta toob näiteks sanskriti sõna
“yoga”, mis põhineb tüvel “Y(uj)”, mis tähendab ühinemist, “O”, mis tähendab
loojat, jumalat või aju, ja “Ga”, mis tähendab liikumist või algatamist.
Sarnaselt sellele võivad teadlased võtta kolm lihtsat tüvisõna – “punane”,
“laser” ja “valgus” – ning moodustada neist ühe kombineeritud sõna
“punane-laser-valgus”, millel on uus tähendus. Tüvisõnade ja reeglite
kasutamine võimaldab tüvisõnu tundvatel teadlastel välja nuputada võõra termini
tähenduse ning annav võimaluse luua edaspidi lihtsalt mõistetavaid uusi
termineid.
Meeskonna liige, biofüüsik John Elliot ütles, et NISTi meeskond on juba
rakendanud oma tüve-põhise sõnavara reegleid keemilistele struktuuridele PubChem’is (miljonite ühendite
ja keemiliste ainete ”koletus andmebaasis“), üle-maailmses proteiinide
andmebaasis (PDB) ja spetsiifilistes NISTi andmebaasides. Kuigi teaduslikud andmebaasid
ei ole veel jõudnud miljardite kasutajateni, nagu Facebook, kasutavad paljud
teadlased NIST’ist ja mujalt neid juba
aktiivselt.
Suhete kaardistamine
Kui esialgne sõnavara oli valmis, töötas NISTi meeskond molekulide ja
teaduslike eksperimentide kategooriate loomisega hierarhilisel moel, mis
võimaldaks otsingul anda kõikehõlmava, kuid täpse tulemuse. „Tavaline probleem
paljude otsingusüsteemide puhul on see, et nad annavad liiga palju tulemusi,“
ütles Elliot. Elliot kirjeldas oma meeskonna lähenemist kui sarnast sellele,
kuidas leida pakk Doritose krõpse suures supermarketis. „Esmalt leiad
toiduainete sektsiooni, siis on hierarhias järgmiseks snäkid, seejärel leiad
chipsid ja siis saad kiiresti teada, kas Doritose krõpse on või ei ole,“ ütleb
Elliot. „Nii leiad suhteliselt kiiresti, kas neil on soovitud kaup, olgu
supermarketis kasvõi miljon toodet.“ Meeskond ütleb, et hierarhiline lähenemine
abistab samuti teadlasi, kes soovivad valida võtmesõnu oma uurimistööde
indekseerimiseks.
Meeskonna sõnul on teadlaste poolt loodud tohutu hulga andmete
organiseerimine on suur väljakutse, kuid ka potentsiaalne kasu on tohutu.
Efektiivsed graafilised otsingud võimaldavad teadlastel kiiresti
identifitseerida keemilisi struktuure ja omadusi, mis on vajalikud uute
ravimite toimeainete või uute materjalide (nagu näiteks kõrge efektiivsusega
lennukiturbiinid või painduvad päikese-elemendid). Need tulemused on rohkem kui
väärt üht Facebooki Like’i.
1 kommentaari :
شركة تخزين اثاث بالرياض
مستودعات تخزين اثاث بالرياض
تخزين اثاث بالرياض
Postita kommentaar