OpenAI藉由微調GPT-3模型來生成整本書合理的摘要,其品質甚至能夠與人工編寫的摘要品質相比擬。這項研究最終目的是要解決機器學習的對應問題(Alignment Problem)
#看更多 https://www.ithome.com.tw/news/146876
同時也有2部Youtube影片,追蹤數超過2萬的網紅紅桔 HungJie,也在其Youtube影片中提到,\\++++本集摘要++++// 這集帶大家認識海燈籠農場. 在建造的時候.需要注意哪些事情. 如何提升深海守衛的生成機率呢 \\++++溫馨提示++++// 本片含大量加速處理.以及走路晃動效果.如果無法適應請斟酌. 目前不考慮䆁出地圖檔.請不用費心詢問了.謝謝配合. \\++++開啟YouT...
生成 摘要 在 DavidKo Learning Journey Facebook 的最佳解答
[Accelerate State of DevOps 2021 快速摘要]
找一些自己有興趣的地方, 快速用 Google 翻譯一下
主要發現
1. 表現最好的人正在成長並繼續提高標準
在我們的研究中,優秀的執行者現在佔團隊的 26%,並且縮短了他們對生產變更的準備時間。該行業繼續加速發展,團隊從中看到了有意義的好處。
2. SRE 和 DevOps 是互補的理念
利用我們的站點可靠性工程 (SRE) 朋友概述的現代運營實踐的團隊報告了更高的運營績效。優先考慮交付和卓越運營的團隊報告了最高的組織績效。
3. 越來越多的團隊正在利用雲,並從中看到了顯著的好處
團隊繼續將工作負載轉移到雲中,而那些利用雲的所有五種功能的團隊會看到軟件交付和運營 (SDO) 性能以及組織性能的提高。多雲的採用也在增加,因此團隊可以利用每個提供商的獨特功能。
4. 安全的軟件供應鍊是必不可少的,也是驅動性能的驅動因素
鑑於近年來惡意攻擊的顯著增加,組織必須從被動實踐轉變為主動和診斷措施。在整個軟件供應鏈中集成安全實踐的團隊快速、可靠和安全地交付軟件。
5. 良好的文檔是成功實施 DevOps 功能的基礎
我們第一次測量了有助於這種質量的內部文檔和實踐的質量。擁有高質量文檔的團隊能夠更好地實施技術實踐並整體表現得更好。
6. 在充滿挑戰的情況下,積極的團隊文化可以減輕倦怠
團隊文化對團隊交付軟件和實現或超越組織目標的能力有很大影響。在 COVID-19 大流行期間,具有生成性 1,2 文化的包容性團隊經歷較少的倦怠。
=========================================================
Technical DevOps capabilities
我們的研究表明,通過採用持續交付進行 DevOps 轉型的組織更有可能擁有高質量、低風險和具有成本效益的流程。
具體而言,我們衡量了以下技術實踐:
• 鬆散耦合架構
• 基於主幹的開發
• 持續測試
• 持續集成
• 使用開源技術
• 監控和可觀察性實踐
• 數據庫更改管理
• 部署自動化
我們發現,雖然所有這些實踐都改進了持續交付,但鬆散耦合的架構和持續測試的影響最大。
例如,今年我們發現,達到可靠性目標的精英執行者採用松耦合架構的可能性是低績效同行的三倍。
松耦合架構 (Loosely coupled architecture)
我們的研究繼續表明,您可以通過努力減少服務和團隊之間的細粒度依賴關係來提高 IT 性能。事實上,這是成功持續交付的最強預測因素之一。使用鬆散耦合的架構,團隊可以相互獨立地擴展、失敗、測試和部署。團隊可以按照自己的節奏前進,小批量工作,減少技術債務,並更快地從失敗中恢復。
持續測試和持續集成
與我們前幾年的發現類似,我們表明持續測試是成功持續交付的有力預測因素。達到可靠性目標的精英執行者利用持續測試的可能性是其 3.7 倍。通過在整個交付過程中結合早期和頻繁的測試,測試人員與開發人員在整個過程中一起工作,團隊可以更快地迭代和更改他們的產品、服務或應用程序。您可以使用此反饋循環為您的客戶提供價值,同時還可以輕鬆整合自動化測試和持續集成等實踐。
持續集成還改進了持續交付。達到可靠性目標的精英執行者利用持續集成的可能性是其 5.8 倍。在持續集成中,每次提交都會觸發軟件的構建並運行一系列自動化測試,這些測試會在幾分鐘內提供反饋。通過持續集成,您可以減少成功集成所需的手動和通常複雜的協調。
持續集成,由 Kent Beck 和它起源的極限編程社區定義,還包括基於主幹的開發實踐,接下來討論。
基於主幹的開發
我們的研究一致表明,高績效組織更有可能實施基於主幹的開發,其中開發人員小批量工作並經常將他們的工作合併到共享主幹中。事實上,達到可靠性目標的精英執行者使用基於主幹開發的可能性是其 2.3 倍。低績效者更有可能使用長期存在的分支並延遲合併。
團隊應該每天至少合併他們的工作一次——如果可能的話,一天多次。基於Trunk的開發與持續集成密切相關,所以你應該同時實現這兩種技術實踐,因為它們一起使用時影響更大。
部署自動化
在理想的工作環境中,計算機執行重複性任務,而人類專注於解決問題。實施部署自動化可幫助您的團隊更接近此目標。當您以自動化方式將軟件從測試轉移到生產時,您可以通過實現更快、更高效的部署來縮短交付週期。
您還可以降低部署錯誤的可能性,這在手動部署中更為常見。當您的團隊使用部署自動化時,他們會立即收到反饋,這可以幫助您以更快的速度改善您的服務或產品。雖然您不必同時實施持續測試、持續集成和自動化部署,但當您將這三種實踐結合使用時,您可能會看到更大的改進。
數據庫變更管理
通過版本控制跟踪更改是編寫和維護代碼以及管理數據庫的關鍵部分。我們的研究發現,與表現不佳的同行相比,達到可靠性目標的精英執行者進行數據庫變更管理的可能性要高 3.4 倍。此外,成功進行數據庫變更管理的關鍵是所有相關團隊之間的協作、溝通和透明度。雖然您可以從特定的實施方法中進行選擇,但我們建議,無論何時您需要對數據庫進行更改,團隊都應在更新數據庫之前聚在一起並審查更改。
監控和可觀察性
與前幾年一樣,我們發現監控和可觀察性實踐支持持續交付。成功實現可靠性目標的精英執行者的可能性是其 4.1 倍
擁有將可觀察性納入整體系統健康狀況的解決方案。可觀察性實踐讓您的團隊更好地了解您的系統,從而減少識別和解決問題所需的時間。我們的研究還表明,具有良好可觀察性實踐的團隊會花更多的時間進行編碼。對這一發現的一種可能解釋是,實施可觀察性實踐有助於將開發人員的時間從尋找問題的原因轉移到故障排除並最終回到編碼上。
開源技術
許多開發人員已經利用開源技術,他們對這些工具的熟悉是組織的優勢。閉源技術的一個主要弱點是它們限制了您將知識傳入和傳出組織的能力。例如,您不能聘請已經熟悉您組織工具的人,開發人員也不能將他們積累的知識轉移到其他組織。相比之下,大多數開源技術都有一個社區,開發人員可以使用它來提供支持。開源技術具有更廣泛的可訪問性、相對較低的成本和可定制性。達到可靠性目標的精英執行者利用開源技術的可能性是其 2.4 倍。
我們建議您在實施 DevOps 轉型時轉向使用更多開源軟件。
source: https://cloud.google.com/devops
生成 摘要 在 Facebook 的最佳解答
四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
生成 摘要 在 紅桔 HungJie Youtube 的最讚貼文
\\++++本集摘要++++//
這集帶大家認識海燈籠農場.
在建造的時候.需要注意哪些事情.
如何提升深海守衛的生成機率呢
\\++++溫馨提示++++//
本片含大量加速處理.以及走路晃動效果.如果無法適應請斟酌.
目前不考慮䆁出地圖檔.請不用費心詢問了.謝謝配合.
\\++++開啟YouTube影片下方留言回覆功能++++///
https://youtu.be/zqYmRvn4xIM
\\++++影片相關資訊++++//
繪師: Nadia 娘娘
材質包: Faithful Reborn 64x64 (已經無載點)
背景音樂(BGM): YouTube 音樂庫
世界種子碼 :8930829678502325368
\\++++娘娘的Youtube頻道++++//
https://www.youtube.com/user/nadiaxhana
\\++++紅桔的FB專頁++++//
https://www.facebook.com/chieh68
===動画研修工房群網夥伴==
NoYoC
https://www.youtube.com/channel/UCBtFEqot7Og2jWNF2CvFdyQ
Miko
https://www.youtube.com/channel/UCrP-nEaRkpMZ5lVv3Aygr7g
Q咪
https://www.youtube.com/channel/UC7sVA8SGQGoGZMlj5kx0ioA
廖桑
https://www.youtube.com/channel/UC3Jf0uZUV2lQ_1mdsIqVgAg
秋刀魚
https://www.youtube.com/channel/UC8w-_syMjqlArJqeYHO5-tA
老免
https://www.youtube.com/channel/UCjtmOoKeJ2WkU3MfKPUvqoQ
但丁
https://www.youtube.com/channel/UC3pll1789FZ0AEw4I59unuQ
馬亞
https://www.youtube.com/channel/UCjWGOeIxRuhS10_23w8zbHQ
米雷
https://www.youtube.com/channel/UCgrF6QECCWb-RIsRjY8u7HA
孟孟
https://www.youtube.com/channel/UC7wNoLtx0t1_YMCITvw6HrA

生成 摘要 在 接棒啟蒙計畫 Youtube 的最佳貼文
接棒啟蒙影片電子報 13.06.12
接棒啟蒙的朋友們大家好,祝大家端午佳節愉快,
接棒啟蒙第53次會議 影片摘要: http://youtu.be/SWy9XwDcnsI
本周的影片會議紀錄內容摘要如下:
一,我們也把前進達仁鄉計畫的課程表討論出來了,包括了DISC心理分析,音樂創作,摺汽球,KNOW活動,創業實作坊,攝影實作,準備了眾多精采課程,希望能給達仁鄉的學生們,一個精彩又不失意義的夏令營。
二,為了6.16接棒啟蒙月會-夢想接力賽,我們做了接棒啟蒙桌遊的教學與許多項細節討論。各組組長在會議時演練了月會簡報內容,有小組長一口氣做了十幾張的投影片,也請大家敬請期待。
三,我們招募三位在學的實習生成為接棒啟蒙的夥伴的計畫正在進行中,預計到6/20號前,希望招募到適合的在學生來成為我們的夥伴,一起為教育做點事情,也幫他們創造很棒的實習經驗,請大家也幫忙留意有沒有適合的在學生(大學或研究所)可以推薦給我們喔。
相關內容請看招募網頁: http://thebatonproject.org/2013_internship/
謝謝您的關注。
-----------------------------------------------
發現美好的天份與熱情,為人所用 - 接棒啟蒙計畫
-----------------------------------------------
http://thebatonproject.org/
Facebook粉絲頁
http://www.facebook.com/BatonEnlightenmentProject
Facebook社團頁
http://www.facebook.com/groups/264421190314520/
會議記錄下載:
2012: http://bit.ly/13ucfpc
2013: http://bit.ly/VF8OKR
