Kërkimi i Luginës së Siliconit për të ruajtur Zërin e Stephen Hawking

Si një ekip i Silicon Valley ndihmoi në rindërtimin e tingullit të tij të veçantë robotik

Patti Price, një konsulent për teknologjinë e të folurit dhe Eric Dorsey, një menaxher inxhinierik, janë pjesë e ekipit që ka punuar për të shpëtuar zërin e njohur të Stephen Hawking kur 30 vjeçari i pajisjes që prodhon atë filloi të dështojë. Foto: Michael Macor, The Chronicle

Nga Jason Fagone

Eric Dorsey, një inxhinier 62-vjeçar në Palo Alto, po shikonte TV të martën në mbrëmje, kur ai filloi të merrte tekste që Stephen Hawking kishte vdekur. Ai ndezi lajmet dhe pa klipet e fizikantit të famshëm duke folur në zërin e tij ikonik android - zëri që Dorsey kishte kaluar aq shumë kohë sa një i ri duke ndihmuar në krijimin, dhe pastaj, shumë më vonë, për të shpëtuar nga shkatërrimi.

Dorsey dhe Hawking ishin takuar për herë të parë gati 30 vjet më parë. Në Mars të vitit 1988, Hawking po vizitonte UC Berkeley gjatë një turneu ligjor tre javor.

Në 46 vjeç, Hawking ishte tashmë i famshëm për zbulimet e tij në lidhje me fizikën kuantike dhe vrimat e zeza, por jo aq i famshëm sa do të ishte. Shitësi i tij më i mirë, "Një histori e shkurtër e kohës", ishte një javë larg nga lirimi, dhe kalifornianët ishin kuriozë për këtë profesor britanik nga Universiteti i Kembrixhit, duke paketuar vendet e bisedimeve të tij publike, duke iu afruar në darkë. Hawking lëvizi brenda ndërtesave dhe shkon në shkallë në një karrocë me një vend prej lëkure deleje, duke zmadhuar zhurmën me një nuç të një levë, duke u shqetësuar ndërsa la gazetarët dhe infermierët e tij në pluhur.

Patti Price, një konsulent për teknologjinë e të folurit, tregon klipet e vjetra dhe të reja të zërit të Stephen Hawking që po punojnë në Palo Alto. Eric Dorsey dhe Price janë pjesë e ekipit në atë përpjekje për të shpëtuar zërin e Stephen Hawking. Zëri dallues, robotik i fizikanit me famë botërore kur pajisja 30-vjeçare që e gjeneroi atë filloi të dështojë. Foto: Michael Macor, The Chronicle

Kur foli, ishte në zërin e një roboti, një zë që dilte nga një kuti gri e fiksuar në pjesën e pasme të karriges së tij. Sintetizuesi i zërit, një produkt tregtar i njohur si CallText 5010, ishte një risi atëherë, jo ende një pjesë e identitetit të tij; ai do të fillonte ta përdorte atë vetëm tre vjet më parë, pasi sëmundja e neuronit motorik skleroza laterale amiotrofike vodhi aftësinë e tij për të folur. Hawking përzgjodhi copa teksti në një ekran video duke lëvizur faqe, dhe CallText e ktheu tekstin në të folur. Në fillim të një ligjërate, Hawking bëri shaka për këtë: "Problemi i vetëm," tha ai, për të qeshur të mëdha, "është se kjo më jep një theks amerikan."

Dorsey ishte me Hawking për një pjesë të këtij udhëtimi, duke etiketuar së bashku si një lloj autoriteti në zë, duke shpjeguar veprimet e tij për gazetarët. Ai punoi në kompaninë Mountain View që prodhoi CallText 5010, një bord hardware me dy patate të skuqura kompjuterike që drejtonin softuer personal.

Një 32-vjeçar optimist, Dorsey ishte i qetë nga natyra, por i nxitur. Ai ishte bashkuar me Speech Plus si një praktikant, i tërhequr nga misioni i tij për të ndihmuar të zërit dhe paaftët; tani ai drejtoi një ekip inxhinierësh dhe të paktën 20,000 rreshta të kodit të tij ishin në CallText, produkt që i dha zë shkencëtarit më të famshëm të epokës së tij.

"Ne po afrohemi t'i përgjigjemi pyetjeve të vjetra," tha Hawking në mbyllje të një ligjërate. "Pse jemi ketu? Nga kemi ardhur? Faleminderit që më dëgjuat ".

Në fund të turneut të tij në Kaliforni, fizikani i dha Dorseyit një kopje të nënshkruar të librit të tij të ri, gjurmët e tij të shtypura në mbulesën e brendshme.

Hawking u kthye në Kembrixh, Dorsey në jetën e tij në Kaliforni.

Njëzet e gjashtë vjet kaluan para se të përsërisnin shtigjet përsëri.

Në vitet e teknologjisë, kjo është një mijëvjeçar. Ndodhi Interneti. Lugina e Silikonit lulëzoi, zhytej, përsëri lulëzoi. Apple, Amazon, Facebook, Google, Uber.

Dorsey ndërkohë u largua nga Speech Plus, e cila falimentoi dhe u shit në një seri ndërmarrjesh të tjera. Ai u martua dhe pati fëmijë. Ai u bashkua me një tempull Budist. Ai përfundimisht la fushën e teknologjisë së të folurit krejt, duke u bërë një udhëheqës inxhinierik në prodhuesin DVR TiVo.

Teknike, ai do të mësonte, lëviz kaq shpejt. "Ka një iPhone të ri çdo vit," thotë Dorsey. "Everythingdo gjë thjesht varroset në pluhurin e historisë shumë shpejt."

Kjo është arsyeja pse, kur një email nga Universiteti i Kembrixhit arriti të dalë nga bluja në 2014, Dorsey u befasua. Ai erdhi nga ndihmësi teknik i Hawking, Jonathan Wood, i cili ishte përgjegjës për sistemet e komunikimit të Hawking.

Wood shpjegoi diçka kaq të pamundur sa që Dorsey kishte vështirësi ta kuptonte në fillim: Hawking ishte akoma duke përdorur sintetizuesin e fjalës CallText 5010, një version i cili aktualizohej së fundmi në 1986. Në afro 30 vjet, ai kurrë nuk kishte kaluar në teknologji më të re. Hawking e pëlqente zërin ashtu si ishte dhe kishte refuzuar me kokëfortësi opsionet e tjera. Por tani pajisja ishte duke treguar veshin dhe lotin. Nëse do të dështonte tërësisht, zëri i tij dallues do të humbiste në shekuj.

Zgjidhja, besoi Wood, ishte të përsërisim pajisjen e kalbjes në një softuer të ri, për të transplantuar disi një sintetizues zëri 30-vjeçar në një laptop modern - pa ndryshuar zërin e zërit. Për vite të tëra, ai dhe disa kolegë në Kembrixh kishin eksploruar qasje të ndryshme. Didfarë mendoi Dorsey?

Tridhjetë vjeç? Mendoi. Oh Zoti im.

Nuk do të ishte e lehtë. Ata mund të duhet të gjejnë kodin burim të vjetër. Ata mund të duhet të gjejnë patate të skuqura origjinale dhe manuale për ato patate të skuqura. Ata nuk mund t’i blinin më, kompanitë nuk ekzistojnë. Zgjidhja e problemit mund të nënkuptojë montimin e një gërmimi arkeologjik përmes një epoke të vjetëruar të teknologjisë.

Por ishte për Stephen Hawking.

"Le ta përfundojmë", tha Dorsey.

Poeti Longfellow dikur shkroi se zëri i njeriut është «organi i shpirtit». Më shumë se çdo pjesë tjetër prej nesh, zëri ynë shpreh kush jemi dhe luhatjet më të vogla lëkunden kuptimi në mënyra që janë të vështira për t'u kuptuar nga kompjuterët. Ju flisni një fjali, dhe intonacioni rritet ose bie në varësi të faktit nëse jeni duke bërë një deklaratë ose duke bërë një pyetje. Ju e bëni atë pa menduar, por një kompjuter duhet të bëjë një supozim.

Zërat e sotëm të sintetizuar, si Siri i Apple, mbështeten në biblioteka të paracaktuara të tingullit natyror. Aktorët e zërit regjistrojnë biblioteka të mëdha të fjalëve dhe rrokjeve, dhe programet e programeve kompjuterike i mbledhin ato dhe i rindërtojnë ato në fjali në fluturim. Por 30 vjet më parë, kompjuterët mund të prodhonin vetëm një version "shkop-figure" të një zëri njerëzor, thotë Patti Price, një specialist i njohjes së fjalës dhe gjuhëtar në Palo Alto.

Në atë kohë, ajo punoi si postdok në laboratorin e Institutit të Teknologjisë në Masaçusets të Dennis Klatt, një shkencëtar i gjatë, i hollë, i dashur me opera, me origjinë nga Wisconsin. Klatt është kumbari i zërit të Hawking. Ai shpërtheu fytin e tij me rreze X për të matur formën e kutisë së tij të zërit pasi artikulonte tinguj të caktuar, dhe më pas zhvilloi një model programi të të folurit, Model Klatt, bazuar në zërin e tij.

Speech Plus mori modelin e Klatt, e përmirësoi atë dhe e komercializoi atë në produkte të ndryshme, duke përfshirë CallText 5010. Një nga kontributet e Dorsey ishte të shkruante një algoritëm që kontrollonte intonimin e zërit, ngritjen dhe rënien e fjalëve dhe fjalive. Speech Plus do të shesë mijëra sisteme CallText, megjithëse shumë klientë u ankuan se zëri dukej shumë robotik.

Por Hawking e pëlqeu.

E vërtetë, ishte robotike, por ai e vlerësoi se ishte e lehtë për t’u kuptuar: «zhurmë e fortë», siç shpjegon Price. Forma e formës së saj valore ishte më shumë si një seri pllajësh sesa shkëmbinjtë malorë të pjerrët të zërave njerëzorë, të cilat bien më ashpër. Pjerrësia e zjarrtë e zërit të Hawking e bëri atë të ndërpritet zhurma në amfiteatër dhe salla leksionesh. Ai shpesh filloi fjalimet e tij me të njëjtën linjë - "A mund të më dëgjoni?" - dhe audienca do të përgjigjet me një entuziazëm "Po!"

"It'sshtë një unazë për atë që mbetet jashtë," thotë Price.

"Veryshtë shumë e kuptueshme," thotë Dorsey. "Mund ta dëgjoni për një kohë të gjatë, dhe nuk është irrituese."

Ankesa e vetme e Hawking ishte se ajo nuk kishte një theks britanik.

Me kalimin e viteve, pasi zërat sintetikë u rritën më të natyrshëm, duke përfituar nga patate të skuqura më shpejt dhe ruajtje të lirë, Hawking kishte shanse të azhurnohej. Në vitin 1996, një kompani e teknologjisë së të folurit në Massachusetts, e quajtur Nuance, e cila kishte fituar mbetjet e Speech Plus, përmirësoi CallText me kodin e evolucionit softuer që e bëri tingullin e zërit të jetë më i plotë dhe më i shpejtë, më pak robotik, me pauza më të shkurtra midis fjalive - tek inxhinierët, një përmirësim i dukshëm

Ata i dërguan Hawking një mostër të zërit të ri, duke menduar se ai do të ishte i kënaqur. Ai nuk ishte. Ai tha se intonacioni nuk ishte i duhuri. Ai preferoi zërin e vitit 1986, atë të moduluar nga algoritmi i intonacionit të Dorsey. Hawking do të ngjitej me atë.

"E mbaj sepse nuk kam dëgjuar një zë që më pëlqen më mirë," tha ai dikur, "dhe sepse e kam identifikuar me të." Ai mund të ndryshojë në një zë më të butë, por atëherë ai nuk do të tingëllonte si ai vetë.

"Për Stephen, pajisjet e tij janë si një pjesë e trupit të tij," tha Wood, ndihmësi i tij kryesor teknik. "Për ta përmirësuar atë në një pjesë të re të softuerit ose një pjesë të re të pajisjeve ... ai duhet të ndryshojë një pjesë fizike të vetvetes."

Duke filluar rreth vitit 2009, Wood dhe disa të tjerë në Kembrixh filluan të përpiqen të ndajnë zërin e Hawking nga hardueri i dështuar i CallText. Grupi do të përfshinte Peter Benie, një mësues kompjuteri në universitet; Paweł Wozniak, një student i inxhinierisë lokale; dhe Mark Green, një inxhinier me përvojë elektrike me Intel, i cili kishte një lidhje të gjatë me Hawking.

Një opsion që ata konsideruan ishte tweaking një zë sintetik modern si Siri për të tingëlluar më shumë si Hawking. Por sistemet e tipit Siri mbështeten në fuqinë e madhe kompjuterike të reve të Internetit, dhe Hawking nuk mund të besohet vazhdimisht në Internet. Benie provoi gjithashtu një qasje krejt të ndryshme. Ai shkroi një emulator softuerësh për CallText - në thelb një program që do të mashtronte një PC moderne duke menduar se ishte në të vërtetë CallText i vjetër. Por mostrat që prodhoi nuk dukeshin aq besnike për shijen e Hawking.

Në kohën kur Cambridge arriti në Dorsey në vitin 2014, ata po hetonin një rrugë të tretë: gjurmoni kodin e vjetër të burimit të CallText, tani në pronësi të Nuance, dhe portojeni atë në laptopin e Hawking, duke transplantuar zërin e vjetër në një trup të ri të ri.

A ishte e mundur? Dorsey nuk e kishte idenë. Kjo varej nga fakti nëse ai mund ta gjente kodin burimor, ose, duke mos ditur atë, informacion që do t'i linte të inxhinieronte kodin burim.

Ai filloi të dërgonte mesazhe me kolegë që nuk i kishte parë në 30 vjet, duke pyetur nëse kishin ndonjë bric-a-brac të CallText që ende shtronte: bordet, patate të skuqura, manuale. Një djalë gjeti një bord të vërtetë CallText në garazhin e tij. Të tjerët vendosnin skematikë me pluhur.

Kishte ndjenjën e një përleshjeje të çmendur përmes një epoke të hershme të teknologjisë. Por njerëzit kudo u hodhën në shansin për të ndihmuar. "Qëllimi është të shpëtojmë zërin e tij," tha Dorsey. "Sapo të shkoni tek dikush -" Unë kam nevojë që ju të ndihmoni në ruajtjen e zërit të Stephen Hawking "- ata menjëherë zgjohen."

Bashkëpunëtori i tij më i ngushtë në Palo Alto shpejt u bë Price, teknologu i fjalës që dikur kishte studiuar me Klatt, kumbarin e zërit të Hawking. Ajo ishte një mjeshtër në analizimin e mostrave audio, duke krahasuar njëra me tjetrën dhe duke përdorur gjurmët e tyre të gishtave audio për inxhinierin e kundërt se si duhet të ishin krijuar.

Kërkimi arkeologjik i Dorsey për kodin e vjetër doli të ishte një zhgënjyese. Askush në Nuance nuk ishte në gjendje të gjente kodin burimor nga versioni 1986 i CallText. Sidoqoftë, ata gjetën kodin për versionin e aktualizuar të zërit në 1996, në një kasetë rezervë në një zyrë në Belgjikë. Pas disa muaj pune, inxhinierët e Nuance morën kodin dhe po ekzekutuan dhe dërguan një seri ekzemplarësh audio në ekipin e Hawking, duke rregulluar programin për të provuar të përputhen me zërin e vitit 1986.

Nuk funksionoi mjaft. Për një gjë, ndeshja ishte afër, por jo perfekte. Hawking shënoi dallime delikate të tjerët kishin probleme për të parë. "Likeshtë si të njohësh zërin e nënës suaj," tha Price. "Kur i dëgjon ata përmes telefonit, ata thonë dy rrokje dhe ti e di nëse është ashtu apo jo".

Ështja tjetër ishte se Nuance zotëronte kodin, jo Hawking. Fizikanti i famshëm kishte pasur gjithmonë qëllim të kontrollonte përdorimin e zërit të tij. Nëse ekipi shmangte përdorimin e programeve të pronarit, Hawking ka të ngjarë të ketë më shumë kontroll.

Në këtë pikë, ata ndërruan kutitë dhe u kthyen në një nga idetë e tyre origjinale: të imitojnë CallText në softuer, të ngjashëm me atë se si PC-të mund të imitojnë lojëra të vjetra Nintendo që nuk shiten më.

CallText, natyrisht, ishte një bishë më e ndërlikuar se një Nintendo, e drejtuar nga dy patate të skuqura ndërvepruese të vjetëruara dhe komplekse, njëra e bërë nga Intel dhe tjetra nga NEC. Ndërtimi i emulatorit kërkoi bëma heroike të programimit, intuitës dhe operacionit të teknologjisë së lartë. Patate të skuqura duhej të hiqeshin nga një tabelë rezervë CallText me piskatore dhe një kaçavidë. Një emulator për çipin Intel duhej të shkruhej nga e para, nga Benie. Një emulator i veçantë, për NEC, u huazua nga një imitues me burim të hapur Nintendo i quajtur Higan.

Atëherë të gjitha këto pjesë të ndryshme duhet të ishin ngjitur së bashku. Ishte pak si të bëje një enigmë me një bashkim pjesësh figure në një dhomë të errët. Një çip po kalonte një pako misterioze në tjetrën çdo 10 milisekonda. Pse? Wasfarë ishte në të?

Për një kohë, ajo ishte duke shkuar e vështirë. Disa nga mostrat audio ishin aq të varfëra sa askush nuk guxoi t'i luante ato për Hawking.

Përparimi erdhi pak para Krishtlindjes 2017, kur emulatori më në fund filloi të prodhojë tinguj që ngjasojnë me zërin e njohur që ata kishin ndjekur. Kishte disa vështrime të vogla, por sipas Price, zëri ishte një ndeshje akustike me Hawking, format e valëve praktikisht identike. Dallimi i vetëm i perceptueshëm ishte mungesa e një gumëzhitje analoge. "Likeshtë si një version i pastër dhe me shkëlqim i pastruar i zërit të tij," thotë Price.

Kur Benie e dëgjoi për herë të parë, duke dalë nga një kompjuter në vend të kutisë së zërit të Hawking, ai mendoi se tingëllonte më shumë amerikan sesa zëri i Hawking. Ishte thjesht një iluzion aural. Benie e kuptoi se mbase, sa herë që e pa Hawking të fliste, ai e kishte shtuar mendërisht një aluzion të britanizmit.

Gjatë javëve të ardhshme, në Kembrixh dhe Palo Alto, anëtarët e ekipit vazhduan të debugojnë zërin e ri, duke e ushqyer atë copëza fjalimesh të vjetra Hawking dhe shembuj të teksteve plot me presje të rastit, duke dëgjuar rezultatet.

Më 17 janar, ekipi u ndje i gatshëm të demonstronte zërin e ri për Hawking. Wood, Wozniak dhe Benie shkuan në shtëpinë e Hawking në Kembrixh dhe i luajtën mostra në një laptop Linux. Për lehtësimin dhe lumturinë e ekipit, Hawking dha bekimin e tij. Kjo dukej si zëri i tij.

Ata ende kishin nevojë për të transferuar zërin në PC, kështu që përkohësisht, Wood ngarkoi një version të zërit në një bord të pajisjeve miniaturë të njohur si Raspberry Pi. Ai mendoi se Hawking mund të dëshironte të vlerësonte zërin në jetën e përditshme dhe Pi ishte mënyra më e shpejtë për ta ngritur dhe vrapuar.

Më 26 janar, Wood mori Pi në shtëpinë e Hawking dhe e pyeti nëse ai do të donte ta provonte atë. Hawking ngriti vetullat, që do të thoshin "po".

Ekipi e vendosi Pi në një kuti të zezë të vogël, e bashkangjiti në karrigen e Hawking me Velcro dhe e futi në kutinë e zërit. Pastaj ata shkëputën CallText. Për herë të parë në 33 vjet, Hawking ishte në gjendje të fliste pa të.

Wood shikoi me padurim reagimin e Hawking.

"Unë e dua atë," tha Hawking.

Për disa javë në bisedat private, Hawking vazhdoi të flasë përmes emulatorit dhe Raspberry Pi, duke biseduar për fat të mirë me miqtë dhe kolegët. Wood tha, "Ishte kënaqësi të jem në gjendje t'i jepja atij diçka të tillë, që kaq shumë njerëz kanë punuar për kaq shumë vite".

E gjithë kjo që mbeti, hapi i fundit në projekt, ishte të merrte versionin e PC, akoma pak i guximshëm, duke punuar pa probleme. Por pas disa rishikimeve të kodit, më në fund u pa pa gabime.

"Ne i kishim plotësuar të gjitha pengesat teknike," tha Dorsey. "Të gjithë menduan, më në fund, kjo është ajo, do të funksionojë, kjo është bërë."

Dhe kjo është kur Hawking u sëmur, në shkurt.

Sipas Wood, Hawking vazhdoi përdorimin e emulatorit deri në ditët e tij të fundit. Ai ishte në gjendje të bisedonte me të dashurit e tij dhe kujdestarët me programin e ri në Raspberry Pi. Fjalët e fundit që ai foli ndërsa ishte i lidhur në karrigen e tij, çfarëdo qoftë ato, ai foli me një version të zërit të tij që jeton vetëm në kod, copa dhe byte potencialisht të vdekshme.

Të gjithë në këtë projekt kuptuan që Hawking mund të mos jetojë aq gjatë sa të përdorë shumë nga emulatori. Ai kishte qenë i sëmurë më parë, por gjithnjë shërohej. Në vitin 2014, kur Wood kontaktoi për herë të parë me Dorsey, Hawking ishte 72. Sidoqoftë, ata vendosën që bordet e tij të CallText mund të nxisnin gjashtë muaj, ndërsa Hawking mund të jetonte në 80.

Së bashku me trishtimin për vdekjen e Hawking, Dorsey nuk mund të ndihmojë të ndiejmë një zhgënjim. Ai dhe skuadra kishin vrapuar për vite me rradhë për të ndërtuar një gjë të ndërlikuar që kishte punuar bukur, por tani ishte ulur në punë.

Në të njëjtën kohë, projekti e solli përsëri në vetveten e tij më të re, djalë që donte të përdorte inxhinierinë për të kryer vepra të mira dhe për të ndihmuar njerëzit. Të gjithë ato vite më parë, duke punuar në algoritmin e intonacionit në CallText, ai nuk mund të imagjinonte që do të përfundonte duke ndihmuar në përcaktimin e një gjeni të shkencës për botën, dhe madje edhe për veten e tij.

Teknika ndryshon shpejt. Shumica e makinave përfundojnë si pluhur, dhe kur vdesim, zërat tanë vdesin me ne. Zëri i Hawking është i ndryshëm. Bordet origjinale të CallText kanë kaluar në pasurinë e tij, për t'i përdorur ashtu si dëshiron familja e tij. Kështu ka edhe programi i ri, emulatori CallText, i cili mund të portohet në platformat e ardhshme ashtu siç janë shpikur.

Hawking ishte, një i njohur, një ateist, skeptik ndaj jetës së pasme; "Ne kemi një jetë të tillë për të vlerësuar modelin madhështor të këtij universi," tha ai dikur, "dhe për këtë, unë jam jashtëzakonisht mirënjohës." Por nuk ka më asnjë arsye fizike zëri i tij nuk mund të jetojë përgjithmonë.

Jason Fagone është një shkrimtar i stafit të Kronikave në San Francisko. Email: jason.fagone@sfchronicle.com Twitter: @jfagone