Një shkencë e të dhënave nervore: si dhe pse

Udhëzuesi i përafërt për të bërë shkencën e të dhënave në neuronet

Një tru që bën shkencën e të dhënave. Kredia: Truri nga Matt Wasser nga Projekti Nas

Qetësisht, në mënyrë të fshehtë, një lloj i ri i neuroshkencëtarit po merr formë. Nga brenda rradhëve të shumtë të teoricienëve janë ngritur ekipe të neuroshkencëtarëve që bëjnë shkencë me të dhëna mbi aktivitetin nervor, mbi ndarjen e rrallë të qindra neuroneve. Jo krijimi i metodave për analizimin e të dhënave, megjithëse të gjithë e bëjnë këtë. Jo mbledhja e atyre të dhënave, sepse kjo kërkon një grup aftësish tjetër, të frikshëm. Por neuroshkencëtarët duke përdorur gamën e plotë të teknikave moderne të llogaritjes në ato të dhëna për t'iu përgjigjur pyetjeve shkencore në lidhje me trurin. Një shkencë e të dhënave nervore është shfaqur.

Rezulton se unë jam një prej tyre, kjo klan i shkencëtarëve të të dhënave nervore. Aksidentalisht. Me sa mund të them, kështu lindin të gjitha fushat shkencore: rastësisht. Studiuesit ndjekin hundët, fillojnë të bëjnë gjëra të reja dhe befas zbulojnë se ka një turmë të vogël të tyre në kuzhinë në festa (sepse aty ku janë pijet, në frigorifer - shkencëtarët janë të zgjuar). Pra, këtu është një shfaqje e vogël për shkencën e të dhënave nervore: pse po shfaqet, dhe si mund të vendosemi për ta bërë atë.

Pse është e njëjtë me të gjitha fushat e shkencës që kanë zbuluar një shkencë të të dhënave: sasia e të dhënave po del nga dora. Për shkencën e regjistrimit të shumë neuroneve, kjo përmbytje e të dhënave ka një arsyetim shkencor, të llojeve. Truri funksionon duke kaluar mesazhe midis neuroneve. Shumica e këtyre mesazheve marrin formën e pulseve të vogla të energjisë elektrike: spikes, ne i quajmë ato. Pra, për shumë njerëz duket logjike që nëse duam të kuptojmë se si funksionojnë trurin (dhe kur ato nuk funksionojnë), ne kemi nevojë për të kapur të gjitha mesazhet që kalohen midis të gjitha neuroneve. Dhe kjo do të thotë të regjistroni sa më shumë thumba nga sa më shumë neurone të jetë e mundur.

Një truri i bebes zebrafish ka rreth 130,000 neurone, dhe të paktën 1 milion lidhje midis tyre; një tru me gunga ka rreth një milion neurone. Ju mund të shihni se si kjo do të dilte nga dora shumë shpejt. Tani për tani ne regjistrojmë diku midis dhjetëra deri në disa qindra neurone në të njëjtën kohë me pajisje standarde. Në kufijtë janë njerëzit që regjistrojnë disa mijëra, dhe madje edhe disa duke marrë dhjetëra mijëra (megjithëse këto regjistrime kapin aktivitetin e neuroneve me ritme shumë më të ngadalta se sa neuronet mund të dërgonin pikat e tyre).

Ne e quajmë këtë sistem të çmendurisë neuroshkencë: neuroshkencë, për studimin e neuroneve; sisteme, për të guxuar të regjistrojnë nga më shumë se një neuron në një kohë. Dhe të dhënat janë të ndërlikuara nga mendja. Ajo që ne kemi janë dhjetëra mijëra serra kohore të regjistruara njëkohësisht, secila rrjedhë e ngjarjeve pikante (pikat aktuale, ose ndonjë masë indirekte e tyre) nga një neuron. Sipas përkufizimit, ato nuk janë të palëvizshme, statistikat e tyre ndryshojnë me kalimin e kohës. Shkalla e veprimtarisë së tyre u përhap në shumë urdhëra të përmasave, nga soditje e qetë si murgu tek "kazani i daulleve në një tunel me erë". Dhe modelet e tyre të veprimtarisë variojnë nga rregullsia si ora, deri te belbëzimi dhe spërkatja, deri te alternimi midis periudhave të manisë dhe rrjedhave të rraskapitjes.

Tani martohu me sjelljen e kafshës nga të cilën ke regjistruar neuronet. Kjo sjellje është qindra prova zgjedhjesh; ose lëvizjet e krahut; ose rrugët e marra përmes një mjedisi. Ose lëvizja e një organi kuptimor, ose tërë pozicioni i muskulaturës. Përsëriteni për kafshë të shumta. Mundësisht rajone të shumta të trurit. Dhe ndonjëherë trurin e tërë.

Ne nuk kemi të vërtetë. Nuk ka një përgjigje të duhur; nuk ka etiketa trajnimi për të dhënat, përveç sjelljes. Ne nuk e dimë se si trurin kodifikojnë sjelljen. Pra, ne mund t'i bëjmë gjërat me etiketa të sjelljes, por pothuajse gjithmonë e dimë se këto nuk janë përgjigja. Ata janë thjesht të dhëna për "përgjigjen".

Neuroshkenca e sistemeve është atëherë një shesh lojrash i pasur për ata që mund të martohen me njohuritë e tyre të neuroshkencës me njohuritë e tyre për analizimin e të dhënave. Një shkencë e të dhënave nervore po lind.

Si është - ose mund të bëhet -? Këtu keni një udhëzues të përafërt. Raison d'etre i shkencëtarit të të dhënave nervore është të shtrojë pyetje shkencore të të dhënave nga neuroshkenca e sistemeve; të pyesim: si funksionojnë të gjithë këta neurone për të bërë punën e tyre?

Ekzistojnë afërsisht tre mënyra se si t'i përgjigjemi kësaj pyetjeje. Ne mund t'i shohim këto tre mënyra duke shikuar korrespondencën midis klasave të krijuara të problemeve në mësimin e makinerisë dhe sfidat llogaritëse në neuroshkencën e sistemeve. Le të fillojmë duke parë se me çfarë kemi të punojmë.

Ne kemi disa të dhëna nga n neuronet që kemi mbledhur me kalimin e kohës. Ne do t'i grumbullojmë këto në një matricë do t'i quajmë X - po aq kolona sa neuronet, dhe sa më shumë rreshta sa pikat e kohës që kemi regjistruar (ku varet nga ne sa zgjat një "pikë-kohë"): ne mund të bëje të shkurtër, dhe thjesht duhet të ketë secilën regjistrim të hyrjes një 1 për një majë, dhe 0 ndryshe. Ose mund ta bëjmë të gjatë, dhe secila hyrje regjistron numrin e pikave gjatë asaj kohe të përfunduar). Gjatë asaj kohe, gjëra kanë ndodhur në botë - përfshirë atë që trupi ka bërë. Pra, le t'i grumbullojmë të gjitha ato në një matricë, ne do t'i quajmë S - sa më shumë kolona sa ka veçori në botën për të cilat na intereson, dhe sa më shumë rreshta sa pikat e kohës që kemi regjistruar për ato tipare.

Tradicionalisht, mësimi i makinerisë përfshin ndërtimin e tre klasave të modeleve për gjendjen e botës dhe të dhënat e disponueshme: gjeneruese, diskriminuese dhe densitet. Si një udhëzues i përafërt, kjo tabelë tregon se si çdo klasë korrespondon me një pyetje themelore në neuroshkencën e sistemeve:

1 / Modelet e dendësisë P (X): a ka strukturë në thumba? Tingëllon e shurdhër. Por në të vërtetë kjo është thelbësore për një vëzhgim të madh të hulumtimit të neuroshkencës, në të cilën ne duam të dimë efektin e diçkaje (një ilaç, një sjellje, një gjumë) në tru; në të cilën po pyesim: si ka ndryshuar struktura e aktivitetit nervor?

Me një regjistrim të një bande neuronesh, ne mund t'i përgjigjemi kësaj në tre mënyra.

Së pari, ne mund të matim sasinë e trenit të secilit neuron, duke matur statistikat e secilës kolonë të X, si shkalla e pikimit. Dhe pastaj pyesni: cili është modeli P (X) për këto statistika? Ne mund t'i grumbullojmë këto statistika për të gjetur "llojet" e neuronit; ose thjesht përshtaten modele në të gjithë shpërndarjen e tyre të përbashkët. Sido që të jetë, ne kemi një model të strukturës së të dhënave në kokrrizën e neuroneve të vetme.

Së dyti, ne mund të krijojmë modele gjeneruese të të gjithë veprimtarisë së popullatës, duke përdorur rreshtat e X - vektorët e aktivitetit moment-në-moment të gjithë popullatës. Modele të tilla zakonisht synojnë të kuptojnë se sa prej strukturës së X mund të rikrijohet nga vetëm disa kufizime, qofshin ato shpërndarja e sa vektorëve kanë sa shumë pikëza; ose lidhjet në çift midis neuroneve; ose kombinime të tyre. Këto janë veçanërisht të dobishme për të punuar nëse ka ndonjë salcë të veçantë në veprimtarinë e popullatës, nëse është diçka më shumë se aktiviteti kolektiv i një grup neuronesh të pavarur ose të mërzitshëm.

Së treti, mund të marrim qëndrimin se aktiviteti nervor në X është një realizim i madh dimensional i një hapësire dimensionale të ulët, ku numri i dimensioneve D << n. Në mënyrë tipike nënkuptojmë me këtë: disa neurone në X janë të lidhura, kështu që ne nuk kemi nevojë të përdorim tërë X për të kuptuar popullsinë - përkundrazi ne mund t'i zëvendësojmë ato me një paraqitje shumë më të thjeshtë. Ne mund të grumbullojmë seritë kohore drejtpërdrejt, kështu që duke e zbërthyer X në një grup matricash N më të vogla X_1 në X_N, secila prej të cilave ka lidhje relativisht të forta brenda tij, dhe kështu mund të trajtohet në mënyrë të pavarur. Ose mund të përdorim një lloj qasjeje për zvogëlimin e dimensioneve si Analiza e Komponentëve Kryesorë, për të marrë një seri të vogël serish kohore që secila përshkruan një formë dominuese të variacionit në veprimtarinë e popullatës me kalimin e kohës.

Ne mund të bëjmë më shumë se kjo. Sa më sipër supozojmë se duam të përdorim zvogëlimin e dimensionit për të shembur neuronet - se ne aplikojmë reduktim në kolonat e X. Por ne mund të shkatërrojmë po aq lehtë kohën, duke aplikuar zvogëlimin e dimensionit në rreshtat e X. Në vend se të pyesim nëse aktiviteti nervor është i tepërt , kjo po pyet nëse momente të ndryshme në kohë kanë modele të ngjashme të aktivitetit nervor. Nëse ka vetëm një pjesë të vogël të këtyre, qartë që dinamika e neuroneve të regjistruara është shumë e thjeshtë.

Edhe këtu mund të hedhim qasje dinamike të sistemeve. Këtu mundohemi t'u përshtatemi modeleve të thjeshta me ndryshimet në X me kalimin e kohës (p.sh. hartëzimi nga një rresht në tjetrin), dhe t'i përdorim ato modele për të kuantifikuar llojet e dinamikës që përmban X - duke përdorur terma si "tërheqës", "separatrix", " nyja e shalës ”,“ bifurcation pitchfork ”dhe“ kolapsi i Arsenalit ”(vetëm njëri prej tyre nuk është një gjë e vërtetë). Dikush mund të argumentojë me siguri se modelet dinamike aq të përshtatshëm janë të gjitha modelet e densitetit P (X), pasi ato përshkruajnë strukturën e të dhënave.

Ferr, ne madje mund të provonim dhe të përshtatnim një model të tërë dinamik të një qarku nervor, një bandë ekuacionesh diferenciale që përshkruajnë çdo neuron, në X, në mënyrë që modeli ynë P (X) të merret në provë çdo herë që ekzekutojmë modelin nga kushte të ndryshme fillestare .

Me këto modele densiteti, ne mund t'i përshtatemi ato veçmas me aktivitetin nervor që kemi regjistruar në një bandë gjendjesh të ndryshme (S1, S2, ..., Sm), dhe t'i përgjigjemi pyetjeve si: si ndryshon struktura e një popullate të neuroneve midis gjumit dhe zgjohen? Apo gjatë zhvillimit të kafshës? Ose gjatë mësimit të një detyre (ku S1 mund të jetë gjykimi 1, dhe S2 gjyqi 2; ose S1 është seanca 1 dhe S2 seanca 2; ose shumë kombinime të tyre). Mund të pyesim gjithashtu: sa dimensione përfshin aktivitetin e neuronit? A janë dimensionet e ndryshme midis rajoneve të ndryshme të lëvore? Dhe a i ka parë dikush çelësat e mi?

2 / Modelet gjeneruese P (X | S): çfarë shkakton një kërcitje? Tani po flasim. Gjërat si modelet lineare-jolineare, ose modelet lineare të përgjithësuara. Në mënyrë tipike, këto modele aplikohen në neuronet e vetme, në secilën kolonë të X. Me to ne po vendosim një model që përdor gjendjen e botës S si input, dhe nxjerr një seri të aktivitetit nervor që përputhet me aktivitetin e neuronit sa më afër që të jetë e mundur. Duke inspektuar peshën e dhënë për secilën karakteristikë të S në riprodhimin e aktivitetit të neuronit, ne mund të përcaktojmë se çfarë duket se neuroni i jep një dreq.

Ne mund të dëshirojmë të zgjedhim një model që ka një fleksibilitet në atë që konsiderohet si "shteti i botës". Ne mund të përfshijmë aktivitetin e vetë të kaluarës së neuronit si një veçori, dhe të shohim nëse kujdeset për atë që bëri në të kaluarën. Për disa lloje të neuroneve, përgjigjja është po. Shpërthimi mund të marrë shumë nga një neuron, dhe duhet të shtrihet për një prehje të barërave para se të mund të shkojë përsëri. Ne gjithashtu mund të mendojmë më gjerësisht, dhe të përfshijmë pjesën tjetër të popullsisë - pjesën tjetër të X - si pjesë të gjendjes së botës S ndërsa neuroni po pushkaton. Në fund të fundit, neuronet herë pas here ndikojnë në shkrepjen e njëri-tjetrit, ose kështu unë jam i detyruar të besoj. Pra, ekziston një shans i vogël që përgjigja e një neuroni në korteksin vizual të mos drejtohet vetëm nga orientimi i një skaji në botën e jashtme, por gjithashtu mund të varet nga ajo që po bëjnë edhe 10000 neuronet kortikale që lidhen me të. Ajo që ne mësojmë atëherë janë neuronet përafërsisht më me ndikim në popullatë.

Ne nuk kemi pse t'i zbatojmë këto modele gjeneruese në neuronet e vetme. Ne mund t'i zbatojmë në mënyrë të barabartë ato në modelet tona të dendësisë; ne mund të pyesim se çfarë po kodon çdo grup, ose dimension, rreth botës. Ose, siç bënë disa njerëz këtu, ne mund të përdorim vetë modelin e densitetit si gjendje të botës dhe të pyesim se cilat tipare të këtij modeli neuronet në rrjedhën e poshtme i japin një dreq.

Llojet e pyetjeve që mund t'i përgjigjemi me këto modele gjeneruese janë mjaft të qarta: cili kombinim i veçorive parashikon më mirë përgjigjen e një neuroni? A ka neurone selektive vetëm për një gjë? Si ndikojnë neuronet në njëri-tjetrin?

3 / Modelet diskriminuese P (S | X): çfarë informacioni mbajnë spikes? Kjo është një pyetje thelbësore në neuroshkencën e sistemeve pasi është sfida me të cilën përballen të gjithë neuronet që janë në rrjedhën e poshtme të popullsisë sonë të regjistruar - të gjitha neuronet që marrin hyrje nga neuronet nga ne kemi regjistruar dhe mbushur në matricën tonë X. Për ata neurone në rrjedhën e poshtme duhet të konstatojnë se çfarë ata duhet të dinë për botën e jashtme bazuar vetëm në thumba.

Këtu mund të përdorim klasifikuesit standardë, ato hyrje harta në rezultatet e etiketuara. Ne mund të përdorim rreshtat e X si hyrje, secilën fotografi të aktivitetit të popullatës, dhe të përpiqemi të parashikojmë një, disa ose të gjitha tiparet në rreshtat korrespondues të S. Ndoshta me një vonesë kohore, kështu që ne përdorim rreshtin X_t në parashikoni gjendjen S_t-n që nuk ishte n hapa në të kaluarën, nëse ne jemi të interesuar se si kodet e popullsisë shprehen që hyjnë në tru; ose ne mund të përdorim rreshtin X_t për të parashikuar gjendjen S_t + n që është n hapa në të ardhmen, nëse ne jemi të interesuar se si kodojnë popullatat për disa efekte të trurit në botë. Si aktiviteti në korteksin motorik që po ndodh përpara se të shkruaj secilën shkronjë tani.

Sido që të jetë, ne marrim disa rreshta (por jo të gjitha, sepse nuk veshim veshje) të rreshtave të X, dhe stërvitni klasifikuesin për të gjetur hartëzimin më të mirë të mundshëm të X në copën përkatëse të S. Pastaj testojmë klasifikuesin se sa mirë mundet parashikoni pjesën tjetër të S nga pjesa tjetër përkatëse e X. Nëse jeni jashtëzakonisht me fat, X dhe S juaj mund të jenë aq të gjatë sa të jeni në gjendje t'i ndani ato në grupe treni, testimi dhe vlefshmërie. Mbajeni të fundit në një kuti të mbyllur.

Sigurisht që mund të përdorim një klasifikues aq të fuqishëm sa na pëlqen. Nga regresioni logjistik, përmes qasjeve Bayesiane, deri te përdorimi i një rrjeti nervor 23 shtresash. Përkundrazi, varet nga ajo që dëshironi nga përgjigja dhe shkëmbimi ndërmjet interpretimit dhe fuqisë për të cilën jeni komod. Shkrimet e mia diku tjetër e kanë bërë të qartë se cilën anë të kësaj tregtie dua ta favorizoj. Por jam i lumtur që u vërtetova gabim.

Modelet e kodimit të neuroneve janë indiferentë, por prekin disa quandarë filozofikë të vjetër dhe të thellë. Testimi i kodimit duke përdorur një model diskriminues supozon se diçka në rrjedhën e poshtme po përpiqet të deshifrojë S nga aktiviteti nervor. Ekzistojnë dy probleme me këtë. Neuronet nuk deshifrohen; neuronet marrin spikes si hyrje dhe prodhim të pikave të veta. Përkundrazi, ata ri-kodojnë, nga një grup spikes në një tjetër grup pikash: ndoshta më pak, ose më ngadalë; mbase më shumë, ose më shpejt; mbase nga një rrymë e qëndrueshme në një lëkundje. Kështu që modelet diskriminuese pyesin më saktë se cilat informata po riodifikojnë neuronet tona. Por edhe nëse e marrim këtë mendim, ekziston një problem më i thellë.

Me shumë pak përjashtime, nuk ka diçka të tillë si një neuron "në rrjedhën e poshtme". Neuronet që kemi regjistruar në X janë pjesë e trurit me tela me ndërlikime, plot sythe të pafund; prodhimi i tyre ndikon në inputin e tyre. Më keq, disa prej neuroneve në X janë në rrjedhën e poshtme nga të tjerët: disa prej tyre hyjnë drejtpërdrejt te të tjerët. Sepse, siç u theksua më lart, neuronet ndikojnë tek njëri-tjetri.

Një manifest i përafërt, mbase i dobishëm, për një shkencë të të dhënave nervore. Shtë i paplotë; pa dyshim që diçka më lart është e gabuar (përgjigjet në një kartolinë në adresën e zakonshme). E mësipërm është një përpjekje për të sintetizuar punën e një grupi laboratorësh me interesa shumë të ndryshme, por një përpjekje e zakonshme për të përdorur këto lloje modeli në grupe të mëdha të të dhënave nervore për t'iu përgjigjur pyetjeve të thella se si funksionojnë trurin. Shumë nga këto janë laboratorë të të dhënave, ekipe që analizojnë të dhëna eksperimentale për t'iu përgjigjur pyetjeve të tyre; për të përmendur disa - Johnathan Jastëk; Machens Christian; Konrad Kording; Kanaka Rajan; John Cunningham; Adrienne Fairhall; Philip Berens; Cian O'Donnell; Parku i Memës; Jakob Macke; Gaspër Tkacik; Oliver Marre. Um, mua Të tjerët janë laboratorë eksperimentalë me prirje të forta të shkencës së të dhënave: Anne Churchland; Mark Churchland; Nicole Rust; Krishna Shenoy; Carlos Brody; shumë të tjera i kërkoj falje që nuk e kam emërtuar.

Ka konferenca ku kjo lloj pune është e mirëpritur, madje jo edhe e inkurajuar. Një ditar për shkencën e të dhënave nervore është në rrugën e vet. Diçka po ndërton. Ejani, të bukurat * e të dhënave.

* po, unë u detyrova t'i referohem të dhënave si njëjës për ta bërë atë shaka koprac për të punuar. Fakti që unë po shkruaj këtë shënim për të shpjeguar këtë do t'ju japë disa ide të vëmendjes së shpejtë ndaj detajeve të të dhënave nervore që shkencëtarët presin.

Dua më shumë? Na ndiqni në Spike

Twitter: @markdhumphries