<th id="ik4gr"><pre id="ik4gr"></pre></th>
<rp id="ik4gr"></rp>
    <dd id="ik4gr"></dd>

  1. <rp id="ik4gr"><object id="ik4gr"><blockquote id="ik4gr"></blockquote></object></rp>
      <rp id="ik4gr"></rp>
        <button id="ik4gr"><acronym id="ik4gr"></acronym></button>
      1. <rp id="ik4gr"><object id="ik4gr"><input id="ik4gr"></input></object></rp>
        1. 杭州嵌入式培訓
          達內杭州嵌入式培訓中心

          13732203138

          熱門課程

          十個超受歡迎的機器學習Python庫

          • 時間:2018-12-21 14:21
          • 發布:轉載
          • 來源:網絡

          本文為daji盤點了今年歡迎的十個Python機器學習庫,大家一起來看看吧。

          1. Pipenv

          Pipenv 是 Kenneth Reitz 的業余項目,旨在將其他軟件包(例如 npm 和 yarn)整合到 Python 里。它不需要安裝 virtualenv, virtualenvwrapper,不用管理 requirements.txt 文件,并且不用確保依賴版本的可復現性。通過 Pipenv,你可以在 Pipfile 中指定依賴項。該工具可生成一個 Pipfile.lock 文件,使你的構建更具確定性,避免產生難以查找的 Bug。

          當然,Pipenv 還有很多其他特性,并且有棒的技術文檔,因此,先確保檢查完畢,然后在你的 Python 項目中使用它。

          2.PyTorch

          Facebook 的深度學習框架 PyTorch 是今年歡迎的庫之一。

          PyTorch 源于 Torch 框架,同時改善了 Torch 框架,而且 PyTorch 基于 Python 語言。過去的幾年,人們一直用 Python 做數據科學的研究,PyTorch 的出現加快了深度學習的普及。

          值得注意的是,由于實現了動態計算圖范式, PyTorch 已經成為眾多研究人員的首選框架之一。當使用 TensorFlow、CNTK 或者 MXNet 等框架編寫代碼時,你必須首先定義一個稱為計算圖的東西。計算圖制定了代碼將要運行的所有操作,然后代碼會被被編譯并利用框架優化,以便在 GPU 上更快地并行運行。這個范式被稱為靜態計算圖,它很棒,因為你可以利用各種優化,并且圖形一旦構建完成就能運行在不同的設備上。然而,在諸如自然語言處理等任務中,「工作量」往往是可變的:將圖像喂給算法之前,你可以把圖像調整到固定的分辨率,但相同的操作不能適用于語句,因為句子的長度是變化的。這正是 PyTorch 和動態圖的優勢所在,讓開發者在代碼中使用標準的 Python 控制指令,圖形在執行時被定義,給予開發者很大的自由,這對于多任務來講是必不可少的。

          當然,PyTorch 可以計算梯度(就像其他深度學習模型一樣),而且非常快,可擴展性強,所以值得一試。

          3.Caffe2

          雖然聽起來很不可思議,但今年 Facebook 發布了另一個偉大的深度學習框架 —— Caffe2。

          原始的 Caffe 框架廣泛使用了多年, 它憑借無與倫比的性能和經過測試的代碼庫而聞名。然而,近期深度學習的發展趨勢讓該框架在某些方面停滯不前。Caffe2 則是讓 Caffe 跟上潮流的一次嘗試。

          Caffe2 支持分布式訓練、部署(即使是在移動平臺上),新的 CPU 和支持 CUDA 的硬件。PyTorch 可能更適合做研究,而 Caffe2 更加適合大規模部署,就像在 Facebook 上看到的那樣。

          另外,你可以在 PyTorch 里構建并訓練模型,同時用 Caffe2 部署!這不是很棒嗎?

          4.Pendulum

          Pendulum 的優勢之一在于,它是 Python 標準 datetime 替代品,因此你可以輕松地將其與現有的代碼集成,并且在你需要的時候才使用它的功能。Pendulum 的作者特別注意時間分區的處理,默認在每個實例中時間分區是可用的,并且以 UTC 計時。你也可以獲得擴展 timedelta 來簡化 datetime 的計算。

          與其他庫不同的是,Pendulum 努力讓 API 具有可預測的行為,所以你該知道期望什么,如果你正在做與 datetime 相關的工作,那么 Pendulum 能讓你工作得更加開心。詳細信息請查看文檔:https://pendulum.eustace.io/docs/

          5.Dash

          如果你做與數據科學相關的工作,會使用到諸如 Pandas 和 scikit-learn 等 Python 生態系統中的工具,用 Jupyter Notebooks 管理工作流程。但是,你如何向那些不知道怎樣使用這些工具的人分享你的工作呢?你該怎樣構建一個交互界面,使人們可以輕松地處理數據,并讓整個過程可視化?過去,你需要一個專業的 JavaScript 前端團隊來構建這些 GUI。而現在,你不再需要了。

          Dash 是一個可構建 Web 應用,尤其是數據可視化 Web 應用的純 Python 開源庫。它建立在 Flask、Plotly 和 React 之上,并提供這幾個框架的函數抽象接口,從而開發者不必學習這些框架,高效開發。這些應用程序可在瀏覽器和移動設備中使用。

          如果你想了解更多 Dash 的信息,請查閱 https://pendulum.eustace.io/docs/

          6.PyFlux

          Python 中有許多庫可用于做數據科學和機器學習,但當你的數據點是隨著時間變化而變化時(例如股票數據),這就不一樣了。

          PyFlux 是專門針對時間序列開發的 Python 開源庫。時間序列研究是統計學和經濟學的子領域,其目的是用于描述時間序列的行為(in terms of latent components or features of interest),同時也預測時序未來的行為狀態。

          PyFlux 允許使用概率的方法對時間序列建模,并且實現了幾個時間序列模型,如 GARCH。

          7.Fire

          在通常情況下,你需要為你的項目制作命令行界面。除了傳統的 argparse,Python 還有一些很棒的工具,比如 Click 或者 docopt。谷歌今年宣布的 Fire 則采用了不同的方法來解決這個問題。

          Fire 是一個開源庫,可以為任何 Python 項目自動生成一個命令行界面。你幾乎不需要編寫任何代碼或者文檔,你只需要調用一個 Fire 方法并把它傳遞給你想要的命令行界面:一個函數、一個對象、一個類、一個庫,甚至不傳遞任何參數(這會使你的整個代碼進入命令行界面)。

          請閱讀指南來了解它的工作原理:https://github.com/google/python-fire/blob/master/docs/guide.md。

          8.imbalanced-learn

          在理想情況下,我們有完美平衡的數據集,然后非常順利地訓練模型。不幸的是,現實不是這樣的,某些任務的數據集非常不平衡。例如,預測信用卡中的交易行為時,絕大多數(+99.9%)的交易是合法的。如果按照這樣的方式訓練算法,會得到很糟糕的結果,所以在使用這些類型的數據集時要非常小心。

          幸運的是,這個問題已經被充分地研究,也存在著各種各樣的技術來解決該問題。imbalanced-learn 是一個 Python 庫,它提供了相關的技術來解決數據不平衡的問題。另外,它和 scikit-learn 兼容,并且是 scikit-learn-contrib 項目的一部分,非常有用。

          9.FlashText

          在數據清理工作中,你需要搜索文檔并替換特定的內容,這通常用正則表達式完成。但有時候會出現這樣的情況:你需要搜索成千上萬的數據,然后采用正則表達式的方式會變得非常緩慢。

          FlashText 是個更好的選擇。作者在初的基準測試中,FlashText 使整個操作的運行時間大大縮短:從 5 天降到 15 分鐘。FlashText 的優點在于無論搜索條件有多少,運行時間都是一樣的,而隨著搜索條件的增加,正則表達式的運行時間幾乎呈線性增長。

          FlashText 證明了算法和數據結構設計的重要性,即使對于簡單的問題,更好的算法也能夠輕松超越在快 CPU 上運行的樸素實現。

          10. Luminoth

          圖像無處不在,理解其內容對于很多應用程序來說非常重要。慶幸的是,由于深度學習的進步,圖像處理技術有了很大的進步。

          Luminoth 是一個用 TensorFlow 和 Sonnet 構建的開源的計算機視覺 Python 工具包。它可直接支持物體檢測,背后支持的模型是 Faster R-CNN。

          但是,Luminoth 不僅能實現特定的模型,同時它還建立在模塊化和可擴展基礎之上,所以你可以直接定制它現有的部分,或者用新的模型擴展它,用于處理不同的問題,盡可能地重復利用代碼。它提供了可輕松構建深度學習模型的工具:將數據轉換為合適的格式反饋給各種流程中,例如用于增強數據、在一個或者多個 GPU (使用大型數據集時必須進行分布式訓練)上訓練、運行評估指標。

          此外,Luminoth 直接與 Google Cloud 的機器學習引擎集成,即使你沒有強大的 GPU,也能在云端訓練。

          預約申請免費試聽課

          怕錢不夠?就業掙錢后再付學費!    怕學不會?從入學起,達內定制課程!     擔心就業?達內多家實踐企業供你挑選!

          上一篇:如何利用python更改電腦開機密碼?
          下一篇:達內嵌入式培訓靠譜嗎?學什么?

          達內網絡營銷培訓課程怎么樣?

          達內嵌入式培訓靠譜嗎?學什么?

          十個超受歡迎的機器學習Python庫

          如何利用python更改電腦開機密碼?

          選擇城市和中心
          貴州省

          廣西省

          海南省

          香蕉视频在线一级a做爰片免费观看视频 欧美成年性色生活片 百度 好搜 搜狗
          <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>