Facebook Ctrl-labs分享腦機技術:五年實現意念控制商用

要理解神經界面初創公司Ctrl-labs的技術並不容易。這略顯諷刺,因為他們的目標是理解你的大腦意圖並將其化為實際的操作。在日前舉行的Web Summit 2019大會中,Ctrl-labs首席執行官托馬斯·雷爾登(Thomas Reardon)向Venturebeat撰稿人埃米爾·普羅塔林斯基(Emil Protalinski)介紹了腦機界面的工作原理。

成立於2015年的Ctrl-labs是一家總部位於美國紐約的初創公司。他們致力於開發一種能夠將肌肉神經信號轉換為機器可讀命令的腕帶產品。但很快,Facebook在2019年9月正式收購了這支團隊。收購尚未完成,所以雷爾登自簽署協議以來一直保持低調。然而,他渴望向大家進一步介紹神經接口技術,而我們可以從中理解為何Facebook(及整個科技行業)會對這個領域感興趣。

簡而言之,Ctrl-labs希望我們不再是通過鼠標,鍵盤,觸控屏,語音或當前的任何其他輸入來與技術交互。雷爾登及團隊期望在未來數年內允許我們通過大腦意念直接控制技術。

1. “機器學習問題之母”

雷爾登曾多次表示,他們志在解決“mother of all machine learning problems(機器學習問題之母)”。他同時在大會中多次使用了這個短語。值得一提的是,蘋果首席執行官蒂姆·庫克曾將自動駕駛汽車描述為“mother of all AI projects(人工智能項目之母)”。我們都明白自動駕駛汽車的複雜性,但不一定理解機器學習。

雷爾登解釋說:“對於能夠實時解碼神經活動並將其轉化為控制的概念,你的身體能夠做到這一點。每個級聯的神經元序列都是不同的層,比如說皮層,然後它們將輸出發送到脊髓。每組神經元都在解釋前一組,並且在數毫秒的時間內將其轉化為最終行動。”

他繼續道:“首先,你必須捕獲所有的活動,然後必須重新調整其用途。我們正在嘗試通過另一端的機器來做到這一點。僅解碼一小部分就需要大量非常智能的定製算法來實時進行。如果我們可以記錄所有數據,然後在幾週內回來進行分析,我們是可以做到。這就是神經科學的工作方式。大多數研究都是通過這種稱為‘事後處理’的方式完成。我們根據事實對數據進行分析,然後嘗試理解‘神經元的活動如何產生行為?’這是所有神經科學的中心目標。神經活動-最終行為,我們應該如何聯通它們呢?這種神經元的密碼是什麼呢?現在無法實時做到。”

概括來說,自然界中沒有比人腦更複雜的系統。要創建一種無需鑽入人類頭骨就能確定意圖的算法非常困難。解碼單個運動神經元的活動以控制機器是最終的機器學習挑戰。與之相比,其他一切問題都只是弟弟。

雷爾登表示:“我們很容易就DeepMind所取得的突破及其顛覆性的潛能感到興奮。但真正難吭的骨頭是如何實時地做到。”

2. 肌電圖(EMG)

Ctrl-labs在2018年12月展示了Ctrl-kit原型。它由兩部分組成:一個尺寸近似於包含無線電的大型手錶的外殼;一個包含電極的繫留組件。這種腕戴式設備能夠通過藍牙接入PC或智能手機進行處理。

在講解如何將意圖變成行動之前,我們需要理解人Ctrl-labs設備正在檢測的內容。雷爾登指出:“這被稱為表面肌電圖。這是差分感應電極。你的運動神經元會發出動作電位。它沿著穿透肌肉的軸突行進。它能夠擴展開來,並觸及肌肉中的一堆神經纖維,數量達到數百乃至數千。肌肉中的每根神經纖維都可以產生較大的電活動。運動神經元的電活動非常小,不可檢測。它非常小,小到納安至皮安(1安=1000毫安,1毫安=1000微安,1微安=1000納安,1皮安=1000納安)。 你的肌肉神經纖維存在大量的電活動。另一個事實是,肌肉的每一根神經纖維都在產生巨大的電場。”

為了將意圖轉化為行動,EMG設備需要測量由從大腦到手部肌肉的脈衝所引起的電勢變化。他解釋道:“我們是神經科學家,因為我們發現了‘我如何獲取肌肉的電活動,並確定產生這種活動的電活動是什麼?’我們做到了這一點。我們能夠從肌肉的電響應中重建這種脊髓運動神經元的活動。”

3. Motor babbling(蹣跚習得)

雷爾登表示,你可以在大約90秒內學會使用Ctrl-labs腕帶完成一項任務。在這90秒鐘裡面,你和EMG設備之間發生了什麼事情呢?

Motor Babbling(蹣跚習得)是指嬰兒通過自發的、隨機的重複動作來掌握運動技能。例如,嬰兒在出生後不久可以通過手臂的自發性隨機揮舞動作來掌握對手臂的控制。我們承認能夠輕易做到,但嬰兒需要一定的時間試錯掌握,慢慢建立神經映射。Ctrl-labs正是利用了這一點。

他說道:“這與生俱來,比任何一切都要紮根於你的DNA之中,甚於語言,甚於計數,甚於理解語言。你真正擅長的是學習如何運動,尤其是手和嘴。你可以用一種非常巧妙的方式來做到這一點。極其微妙的動作,只有一丁點神經活動。嬰兒需要花費相當時間才能掌握。但你總是這樣做,而且你永遠不會停下來。你基本上可以在一年半左右建立粗略的運動映射。”

為了說明,雷爾登將一杯水放到桌面並要求普羅塔林斯基小抿一口。

他說道:“這是你一生中最難做到的事情。”

這是不是指你難以訓練機器人執行這個動作呢?畢竟手部的軌跡每一次都不同。他指出:“教機器人做這個動作太困難了。涉及到的自由度數,這包括你的輸出容量,手臂包含27個自由度。你小抿一口的動作在一生中執行過1萬次,10萬次,100萬次。但每次都不盡相同。再來一遍的時候又是全新的動作。不同的重量,不同的杯子材質等等。你可以實時實現這個操作。”

4. 利用運動反饋

Ctrl-labs希望利用人類學習掌握身體的方式,重新賦能這項技術,從而允許我們控制技術。

雷爾登解釋說:“你具有這種出色的運動適應能力。你具有與任務相關的總體脈絡圖。‘我必須拿起這只玻璃杯,然後將其移到我的嘴邊’。這沒有認知負擔。你不是說‘我必須停下手頭中的一切並專注於這個喝水動作。’你非常自然地就執行這個動作。你擁有非常巨大的電機反饋回路容量。從本質上講,我們正嘗試以某種方式利用這一點,只需幾秒鐘就能學習和部署運動技能。你大致知道應如何去做,同時很快就予以採用,而且你的表現非常出色。”

歸根結底,大腦只會做一件事情:它可以打開和關閉肌肉。人類非常擅長通過大腦動態地利用肌肉,每次都適應特定的情況。這需要大量的計算,同時不會產生認知負荷的感覺。這就是為什麼他將其稱作“機器學習問題之母”。Ctrl-labs正在嘗試捕獲人類的學習方式。

5. 跳躍的恐龍

谷歌Chrome瀏覽器內置了一款離線遊戲,你可以通過在地址欄中輸入chrome//dino/來進行訪問。Ctrl-labs曾在Web Summit大會利用這款遊戲來演示其技術。

假設你擁有一個Ctrl-labs腕帶,並且希望學習如何令恐龍跳起來。首先,你可以按下一個按鈕。腕帶可檢測肌肉的電活動。你按下按鈕,恐龍就會跳躍。你不斷按,恐龍就不斷跳躍。最終,你可以慢慢不再需要按下按鈕,只需利用意念即可令恐龍跳躍。

在軟件方面採用了“秘製調料”。你不能只是隨意按鍵,然後即可放棄按鍵並用意念操作。雷爾登解釋說:“一開始是因為我們令其基於按鍵跳躍。然後,我們慢慢將其撥回,令跳躍不再是基於按鍵,而是電活動令恐龍跳躍。過去的機器操作都是通過移動完成,所有一切都涉及移動。我們嘗試令你忘卻運動,但保留意圖。”

不必定義你執行的動作。Ctrl-lab不必表明是右手中指點擊了按鈕。實際運動的可以是任何一切,完全任意。可以是拇指按下按鈕,可以是耳朵擺動。

6. 力度調製

雷爾登說道:“這非常酷。我不必告訴你需要停下來。你會開始意識到無論是否按下按鈕,恐龍都會跳躍。當我說‘這是你大腦真正擅長的事情’時,你的大腦正在嘗試解決‘如何用最小的動作來引起反應’的問題?”這就是你大腦所習得的技能。你正在執行的自適應任務是力度調製。你正在嘗試用最少的神經活動來產生肌肉收縮,從而拿起杯子並放到嘴邊。而且,你始終在努力將其最小化。”

當大腦發現正在執行的動作與結果之間沒有任何聯繫時,它將停止進行完整的動作。你現在無需實際移動即可令恐龍跳躍,你只需在腦海中想著恐龍跳躍。Ctrl-labs正在利用我們與生俱來的能力,亦即用最小的努力來完成一項任務。

你很快就可以參加小型培訓課程並用意念控制各款軟件。穿戴設備,然後點擊屏幕以在應用或遊戲中執行特定操作。大約90秒後,你無需點擊屏幕即可執行這一操作。雷爾登表示,人人你都可以做到這一點。

他說道:“這非常可靠。當你第一次親身體驗時,這會是一種非常奇特的體驗。十分有趣。”

7. 文本鍵入

說到按鍵,由於我們在談論終極的輸入設備,所以文本鍵入是一個顯而易見的切入點。令恐龍跳動是一回事,但用意念進行文本輸入又是另一回事。我們之前曾見證過Ctrl-labs的文本鍵入演示,但他們於本月展示的內容則完全不同。Ctrl-labs希望允許你直接形成單詞,不再需要鍵入字詞。

雷爾登表示:“我們有能力同時實際控制語言模型。我們稱其為‘構詞法’。所以,你不是在鍵入字詞,而是實時地形成文字。你可以在單詞之間進行多種選擇,並且可以快速學習如何形成目標單詞,而不是一次輸入一個鍵。”

這種方式的優勢是什麼?速度,一切都在於速度。

他說道:“最終,我們希望你能夠以言語的速度來遣詞造句。存在語音速率可能大約是語言產生認知極限的假設,但顯然文本鍵入不是。如果你言語的速度非常快……你能否以每分鐘250個字的速度鍵入文本呢?今天沒人能做到。我們希望能夠支持所有人做到這一點。屆時,言語表達和這種受控文本輸入方式之間將不再有區別。”

需要明確的是,Ctrl-labs尚未實現這個目標。他們的演示僅顯示每分鐘40個單詞的文本輸入速度。利用鍵盤,任何人都可以通過學習來超過這個速度。但除了速度之外,這顯然存在其他一系列重要的優勢。

8. AR,VR及其他新興平台

雷爾登說道:“這在我所認為的新興平台方面顯然存在巨大的價值。無論是戴在手腕上的計算機還是戴在臉上的計算機,它們都需要全新的文本界面。另外,我們正在押寶語音不會成為你控制機器的方式。這是解決方案的一部分,但不是全能的解決方案。你很少會用到這種解決方案,只是偶爾使用。人們今天使用Alexa的事實可能是最好的證明。它確實有用,但只存在非常特定的情景。我們用文字控制機器,我們今天用文字書寫,用文字進行創作,而語音是一種糟糕的創作方式。”

AR和VR是十分明顯的潛在目標,因為這種沉浸式技術依然缺乏優秀的控制體驗。所以,Facebook收購Ctrl-labs並將其納入至Reality Labs並不令人感到意外。預計這家公司是Facebook自2014年3月以20億美元收購Oculus之後的最大一筆併購案。

用意念進行文本輸入只是Ctrl-labs吸引Facebook注意的眾多用例之一。但再次強調,不是文本輸入本身給人留下了深刻印象,而是實現文本輸入的方式。

9. 意圖,不是想法

雷爾登解釋說:“問題是大腦中的每個神經元已經在工作之中。不是說有一群坐在等待呼召的神經元,而腦機接口的目標是確定其工作。所以,你是否正在試圖解碼一個想法並將其轉變為某種行動呢?我不認識能夠向我解釋何謂想法的科學家。所以我們談論的是意圖而非想法。我們專注於這一點。我們正在努力支持你控制你想要控制的一切。你必須有目的性地希望執行某個操作。”

在恐龍演示中,用戶是非常有意識地控制神經元:“他不會是想,‘嘿,我正在考慮在這裡起跳。’他是在說,‘跳。跳。跳。’他希望跳躍。這會導致脊椎中的運動神經元真正激發。”

10. 突破

雷爾登表示:“最困難的地方不僅僅只是傾聽神經元,並允許你利用這個神經元並以全新的方式控制某些事物,困難的地方是你依然能夠使用這個神經元。我們正在啃的硬骨頭是區分‘你正在使用這個神經元來移動,使用這個神經元來控制身體呢?’和‘你正在使用它來控制機器?’。我認為,我們取得了一些驚人的突破,亦即可以區分同一神經元的不同類型神經活動。”

你如何確定只是一個神經元呢?

雷爾登指出:“我們已經進行了詳盡的證明。我在這裡無法描述,但我們會進行學術發表。不過,我們使用了更傳統的方法來證明這是一個被激活的單個神經元。在我們的世界中,這稱為運動單元,它是一組與單個神經元相對應的神經纖維。這實際上很難證明,但我們認為我們已經通過某種科學嚴謹的方式證明了這一點。”

當Ctrl-Labs發佈其證明時,它將接受標準的同行審閱。雷爾登指出,有關單個神經元突破的一部分已經發表,但最新的突破尚未發表。

11. 何時?

大家最為關心的一個問題是:什麼時候可以商用?十年嗎?雷爾登回答道:“不,要更快。”

五年嗎?他肯定地答到:“我認為不用五年。”

如果您喜歡我們的資訊
有廣告合作的想法與需求, 歡迎 Eamil 與我們聯繫!

我們的 Email 是
cs@creativefuturehk.com





友好鏈結
醫美, 婚禮, 甜品, 旅遊, 情趣用品, 牙醫, 眼科, 素食, 包場, 頭髮, 健康, 化妝品, 安老, 理財, 零食, 旅行社, 清潔, 搬屋, 移民, 日旅, 文憑, 台旅, 才藝, 曼旅, 保險, 辦公室, 求婚, 同志, GT, 源旭, 移民資訊網, 亞美尼亞, 西班牙, 斯洛文尼亞, 塞爾維亞, 阿爾巴尼亞, 波蘭, 台灣, 日本, 英國, 歐洲, 香港人移民資訊網, 波蘭, 台灣,   日本, 澳洲, 加拿大, 英國, 歐洲, 移民諮詢網, 波蘭, 台灣, 日本, 澳洲, 加拿大,
移民傳媒, 香港人移民諮詢網, AM荃灣牙醫, 旺角牙醫, 中環骨科, SM, SM情趣用品, SM旅遊, SM美容, SM香港生髮, MS, MS尖沙咀脫毛, MS銅鑼灣脫毛, MS旺角脫毛, MS中環脫毛, MS中環中醫, MS旺角中醫, MS香港中醫, MS尖沙咀中醫, KM, KM留學, KM情趣用品, MK, MK中環骨科, MK銅鑼灣美容, MK尖沙咀美容, MK中環中醫, MK旺角中醫, MK香港中醫, MK尖沙咀中醫, MA, MA尖沙咀脫毛,   MA銅鑼灣脫毛, MA旺角脫毛, MA中環脫毛, MA香港物流, MAHK物流, MH, MH命理, MH旺骨, MH荃灣牙醫, PH, PH荃灣牙醫, PH旺角牙醫, PH將軍澳牙醫, PH坑口牙醫, PH深水埗牙醫, PH柴灣牙醫, PH尖沙咀牙醫, PH中環牙醫, PH銅鑼灣牙醫, PH銅鑼灣美容, PH尖沙咀美容, PH香港搬屋, PHHK搬屋, PH香港婚紗, PH中環咀婚紗, PH尖沙咀婚紗, MP, MA, HKAM, 亞美尼亞旅遊,
2019.12.14