GitHub 最強 AI 數學解題神器!拍照上傳秒給答案,連微積分都難不倒他
Posted on2019/05/27
TO 精選觀點
【為什麼我們要挑選這篇文章】AI 應用越發奇葩,過去寫數學一支筆、一顆腦,現在連腦都不用,帶個 AI 就行。
中國 GitHub 大神研發數學 AI,透過深度學習與影像識別,打造最強解題神器。每個學生都夢寐以求的數學 AI 究竟怎麼下載?怎麼用?接著看下去。(責任編輯:陳伯安)
作者:量子位/ 曉查 銅靈
一位叫 Roger 的中國學霸小哥的拍照做題程式 mathAI 一下子火了,這個 AI,堪稱數學解題神器。
輸入一張包含手寫數學題的圖片,AI 就能辨識出輸入的數學公式,然後給出計算結果。
不僅加減乘除基本運算,就連高等數學中的微積分都不在話下。
就像下面這樣:
還在苦苦糾結高數作業如何求解?還在東奔西走的找學霸借作業?手握 mathAI,不就是手握了新時代的解題利器嗎?
此項目程式碼已半開源
短短幾天時間,這個項目在微博就收穫了上百次轉發。看到畫風如此新奇,似乎還能開啓無限可能應用,網友們紛紛召喚自己的印象筆記(中國版 Evernote)小助手收藏,大呼:以後教數學就是它了。
作者表示,這個專案已經是半開源狀態了,目前開源的部分可以辨識計算加減乘除簡單運算。
如果想要辨識更加複雜的運算式,可以參考數學公式辨識的論文自己進行擴展。
具體來看看這個解題神器。
深度學習辨識數學題,正確率逼近 80%
全能型選手 mathAI 是怎麼實現這個功能的?
作者在 Github 中介紹說,整個程式使用 python 實現,具體處理流程包括:圖像預處理 → 字元辨識 → 數學公式辨識 → 數學公式語義理解 → 結果輸出。
整個系統的處理流程如下:
圖片預處理主要以 OpenCV 作為主要工具,將圖片中的字元單獨切割出來,避免無關變數對字元辨識的影響。
隨後,國際數學公式辨識比賽資料集(CROHME)對通過卷積神經網路進行訓練。
此外,還進行結構分析,對字元的空間關係進行判定。比如一個字元的上標和下標,含義自然不一樣。
在語義分析階段,就需要匯集上面得到的資訊,判斷運算該如何進行了。節點屬性傳遞過程如下圖所示:
作者在用 160 道手寫測試題進行了測試:
結果表明,平均字元辨識率達到了 96.23%,且系統做題的平均正確率達到了 79.38%。
手把手教學怎麼用
來,實際上手操作下。
作者給出兩種使用模式:網頁模式和介面模式(Interface)。介面模式比較直觀,只需打開網頁上傳圖片即可自動給出解題結果。
下面以介面模式為例介紹一下 mathAI 的安裝使用方法。
首先需要安裝 flask、虛擬環境、科學資料庫 numpy、sympy 等,它們都可以用 pip 安裝。
pip install flask
pip install virtualenv
將項目的 lib.zip 檔解壓到系統目錄的 venv 資料夾下。(lib.zip 可以回覆 lib 獲取)
配置置好運行環境後,用 PyCharm 打開下載好的專案,在載入過程中,PyCharm 會自動安裝好專案依賴的軟體資料庫。
使用命令列進入專案所在目錄,並啓動虛擬環境:
. venv/bin/activate
將 FLASK_ENV 環境變數設置為啓用開發模式:
export FLASK_ENV=development
然後使用指令運行 flask 網站框架 :
export FLASK_APP=welcome.py
flask run
打開流覽器,在位址中輸入 127.0.0.1:5000,即可打開項目網頁。在網頁中輸入一張包含數學公式的圖片,就好返回運算結果。
目前 GitHub 專案頁上的程式碼只支持加減乘除這樣的簡單運算。
中國神人 Roger 的其他 GitHub 發明
做出這個自動求解系統的,還是一位元中國少年。
這位 GitHub ID 為 Roger,本名羅文傑,是中山大學資料科學與電腦學院的研一在讀碩士生,主要攻讀電腦視覺方向。
不僅這個解題神器,在 Roger 的 GitHub 主頁上還能看到其此前參與的很多有趣研究。
比如這個基於帖子的校園互助交友平臺 LiBond。用戶可以在裡面發佈任務,然後使用虛擬幣荔枝進行交易。
羅同學的設想是,有閒置時間的同學可以在此平臺上幫助他人,然後結交好朋友,荔枝幣還能用來兌換喜歡的物品。
再比如,一個基於 C++ 的無禁手五子棋 AI,可以通過 openGL 實現圖形介面。
在這個項目中,羅同學使用了最經典的極大極小博弈樹、alpha-beta 剪枝、置換表等演算法,還附上了核心程式碼。
確認過眼神,是學霸無疑了。
資料來源:https://buzzorange.com/techorange/2019/05/27/math-ai/…
數學公式編輯器 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
AI 的畫作居然可以賣到 1358 萬台幣!生成對抗網路造就這個「演算法美學」
Posted on 2019/06/06
大數據文摘 大數據文摘
【為什麼我們要挑選這篇文章】面對全球人工智慧浪潮,有些人認為藝術創作是 AI 永遠代替不了的工作。而當一幅 AI 畫作在紐約的拍賣上高價成交,這背後意味著什麼?這幅成交價格高於畢卡索畫作的 AI 作品,運用了改良版的生成對抗網路(GAN):創意對抗網路,該系統系統能偏離已經學會的風格進行「創新」,即生成新的藝術品。(責任編輯:方禹涵)
大數據文摘出品
作者:蔣寶尚
2018 年 10 月,紐約佳士得拍賣行在紐約拍賣出了一幅不一般的畫作。
在那次拍賣會上,一共有 363 件畫作「同台競技」,其中包括 20 多幅畢卡索的名畫。最終一幅「特別』的畫作力壓群雄,以 43.25 萬美元(約 1358 萬新台幣)成交,值得注意的是這也是全場的最高價格。
這幅特別的藝術畫屬於肖像作品,並不是出自大師之手,甚至連人類持筆都算不上。這幅畫是由人工智慧繪製,AI 以朦朧的筆觸描繪了一位名叫埃德蒙·貝拉米(Edmond de Belamy)的男士,另外畫作右下角的作者簽名是一個數學方程式。
AI 目前的這個水準值不值這個價暫且不論。但 2018 年 10 月拍賣的這一天或許將被寫入歷史,因為這將意味著人工智慧創作的繪畫作品正式作為「藝術品」被市場接受,「標誌著人工智慧藝術作品將登上世界拍賣的舞台」。
AI 藝術品也有了正常的市場攤位
除了以拍賣的方式出售 AI 畫作,現在 AI 藝 術品也有了正常的市場攤位!
國外一個名為 9 GANs 的藝術館將 AI 算法生成的作品放在了 Fine Art America 以及 Society 6 上面售賣。
注: Society6 是表達自我的市場,擁有成千上萬來自世界各地獨立藝術家設計的優質產品。零售店裡沒有其出售的產品,其主題集中在時尚、藝術、禮品和裝飾品。
在 FineArtAmerica.com 網站,藝術家和攝影師可以上傳他們的藝術品圖片,並設定的價格,向全球的觀眾售賣自己的作品。
此藝術館每小時能夠生成 9 幅藝術畫作,涉及主題包括肖像、抽象、超現實、素描等等。總之市面上存在的種類,這個人工智慧都能生成。
網站主頁更新之後,一個小時之前的 9 幅畫將被永久刪除,按照網站的說法,每一幅畫都是獨一無二的。所以,也對畫作開放下載,只不過下載需要支付 15 美元到 165.99 美元不等(約新台幣 470 到 5210 元)。
下面這幅畫售價 165.99 美元(約新台幣 5210 元),據介紹這是一款金屬印刷品,印刷在鋁板帆布上,支援木框架。這幅畫也有售價 19.99 美元的一款(約新台幣 627 元),不過是紙質印刷品,打印墨水使用 EPSON K3 墨水。也就是說,每一幅畫雖然都是獨一無二的,其「藝術價值」不好估計,同一幅畫之所以有差價是因為其裝飾材料的不同。
據介紹,每幅畫的都是一類被稱為生成對抗網路(GAN)的神經網路生成,具體來說 AI 算法是 StyleGAN 以及輝達( NVIDIA)開發的 Original GAN。
那麼人工智慧會自己創造出藝術品嗎?網站在 FAQ 版面回答道:模型經過數據訓練,可以從大量的例子中學習,當然可以自己生成畫作。
其實,雖然是獨特的原創作品。但卻是大量餵食作品的混合物。生成的畫可能有蒙娜麗莎的形象,有梵谷螺旋般的天空,以及莫內的綠色景象…… 在合成過程中,它以非常低的水準和非常不可預測的方式進行,這也是使這種藝術形式如此有趣的原因之一。
在生成藝術品的同時也刪除了藝術品。在創造稀缺價值的同時,也想告訴我們,利用人工智慧可以無窮無盡的各種圖像。
所以,你對藝術的定義決定了 AI 畫作的價值。
算法美學的背後:生成對抗網路大顯神威
生成對抗網路由兩個相互博弈的神經網路組成,即生成器和鑑別器。生成器負責根據輸入生成數據(輸入可以是噪聲,也可以是一些其他的數據)。鑑別器負責分析數據,並區分這些數據是真實的(來自數據集),或者是虛假的(來自生成器)。在形式上可以看做武學中的左右互博。
上面公式下標 G 和 D 分別代表生成器 G(Generator)和鑑別器 D(Discriminator)。生成器的工作是將方程的值最小化,而鑑別器負責將這個值最大化。生成器 G 和鑑別器 D 會一直博弈,直到達到我們的滿意。
而那幅價值 1358 萬新台幣的藝術品,其作者用超過 8 萬幅 15 到 20 世紀的西方繪畫對算法進行訓練。基於這個龐大的數據集,他創造了一個創意對抗網路(Creative Adversarial Networks,簡稱 CANs)。與原有的 GANs 不同的是,此類型的 GAN 對損失函數稍作了修改。
據其創意對抗網路的論文,他們提出了一個新的藝術創作系統。這個系統能夠通過觀看圖像學習風格進行藝術創作。不僅如此,這個系統還能偏離已經學會的風格進行創新,即生成新的藝術品。他們在實驗的過程中比較了人類參與者觀看系統生成的圖像和藝術家創作的畫作的反應。結果表明:人類完全無法分辨一幅畫是否由機器生成。
而 9GANs 創作畫使用的是 StyleGAN,它來自輝達,可以說是近期紅遍網路的「造假」神器了。與其他生成器不同,StyleGAN 可以根據需要更改生成圖像的結果,繪製出的圖片更加逼真,不僅可以創造假的人類肖像,也被瘋狂應用於其他機器學習應用項目,例如汽車、房間、甚至是動漫頭像等
StyleGAN 不僅可以生成高品質和逼真的圖像,而且還可以對生成的圖像進行較好的控制和理解,甚至使生成可信度較高的假圖像變得比以前更加的容易。
上面這些,換句話說,StyleGAN 專注於模仿,CAN 能夠偏離原有的風格,意味著創新。
算法美學真的是創新美學?
當 AI 戰勝棋手時,人們不時的拋出「藝術創作才是人類的專屬」論調,但當我們看到並不輸於當代藝術家的 AI 畫作時,人們作何感想?
其實,藝術的靈魂決不僅僅只是來源於創作者本人,更多的是我們觀賞者賦予藝術的價值。藝術的存在價值也完全取決於人類對其的理解深度。
一幅世界名畫,對於懂的人來說,可能價值連城,而對於不感興趣的人來說,其可能還不如一張普通的照片有用。
另一方面,不必擔心 AI 藝術作品對人類創作靈感有毀滅性的衝擊。相反,我們應該珍惜 AI 帶給我們的靈感。AI 可以將蒙娜麗莎與梵谷結合,創造出獨特的作品,那麼我們人類將蒙娜麗莎與梵谷結合,並在結合的過程中給予符合人類美學的調節,這樣創造出的作品是不是更有欣賞價值呢!
人類的創造力來源於對生活、對自然的觀察。當算法美學成為我們觀察的一部分,這意味著我們突破自身的道路又多了一條。
附圖:上圖是「假 Airbnb」網站,它也是由 StyleGAN 生成的,網站上的圖片和文字所描繪的根本不是實物。
資料來源:https://buzzorange.com/techorange/2019/06/06/gan-ai-paint/
數學公式編輯器 在 Dcard Facebook 的最佳貼文
簡報 論文也會用到的超實用工具推薦與教學!
再複雜的數學公式只要截圖就可以辨識(#西瓜編)
---------------------------------------------
逛逛 Dcard 有趣文章看不完 🙆
https://go.onelink.me/pNB7/dbab4094
---------------------------------------------
下載軟體之後,只需要按下==Ctrl+Alt+M==,選取數學公式圖片
它就能給你完整的LaTeX代碼,你也可以直接在任務欄中修改代碼
然後復制、黏貼、修改,寫出自己的公式
下面是幾個演示的動畫
這個工具適用於Mac、Windows、Ubuntu系統
適用於所有支持LaTeX的編輯器
若是複製出LaTeX的代碼
我們也可以使用在Word中
但限定最新版本的樣子大家可以試試
若是不支援也可以複製成圖片就好
數學公式編輯器 在 keynote方程式編輯器 的推薦與評價
keynote方程式編輯器- 不知道iwork上的keynote有沒有類似office的方程式編輯器最近 ... 其實不用從打說只要把原本貼上keynote的數學式複製在貼上mathtype 就OK了我自己 ... ... <看更多>
數學公式編輯器 在 MicroSoft 方程式編輯器3.0 的推薦與評價
... <看更多>