<th id="ik4gr"><pre id="ik4gr"></pre></th>
<rp id="ik4gr"></rp>
    <dd id="ik4gr"></dd>

  1. <rp id="ik4gr"><object id="ik4gr"><blockquote id="ik4gr"></blockquote></object></rp>
      <rp id="ik4gr"></rp>
        <button id="ik4gr"><acronym id="ik4gr"></acronym></button>
      1. <rp id="ik4gr"><object id="ik4gr"><input id="ik4gr"></input></object></rp>
        1. 杭州嵌入式培訓
          達內杭州嵌入式培訓中心

          13732203138

          熱門課程

          如何利用python生成QQ詞云圖?

          • 時間:2018-12-21 14:05
          • 發布:轉載
          • 來源:網絡

          詞云圖是怎么做出來的呢?這不今天達內小編就以python爬取QQ說說并生成詞云圖為例,讓你知道這張詞云圖的來龍去脈,一起看看吧。

          想當年,哥哥我還是那么風華正茂、幽默風趣...

          言歸正傳,本次使用的是:

          selenium模擬登錄+BeautifulSoup4爬取數據+wordcloud生成詞云圖

          python培訓班分享如何用python爬取QQ說說并生成詞云圖第一步:BeautifulSoup安裝

          pip install beautifulsoup4

          下表列出了主要的解析器,以及它們的優缺點:

          主要的解析器,以及它們的優缺點

          python培訓班分享如何用python爬取QQ說說并生成詞云圖第二步:selenium模擬登錄

          使用selenium模擬登錄QQ空間,安裝pip install selenium

          我用的是chrom瀏覽器,webdriver.Chrome(),獲取Chrome瀏覽器的驅動。

          這里還需要下載安裝對應瀏覽器的驅動,否則在運行腳本時,會提示:

          chromedriver executable needs to be in PATH錯誤,用的是mac,網上找的一篇下載驅動的文章,https://blog.csdn.net/zxy987872674/article/details/53082896

          同理window的也一樣,下載對應的驅動,解壓后,將下載的**.exe 放到Python的安裝目錄,例如 D:\python 。 同時需要將Python的安裝目錄添加到系統環境變量里。

          qq登錄頁http://i.qq.com,利用webdriver打開qq空間的登錄頁面:

          driver = webdriver.Chrome()

          driver.get("http://i.qq.com")

          利用webdriver打開qq空間的登錄頁面

          打開之后右擊檢查查看頁面元素,發現帳號密碼登錄在login_frame里,先定位到所在的frame,driver.switch_to.frame("login_frame") ,再自動點擊帳號密碼登錄按鈕,自動輸入帳號密碼登錄,并且打開說說頁面,詳細代碼如下:

          打開說說頁面的詳細代碼

          這個時候可以看到已經打開了qq說說的頁面了,注意 部分空間打開之后會出現一個提示框,需要先模擬點擊事件關閉這個提示框。

          部分空間打開之后出現的提示框

          模擬關閉提示框

          同時因為說說內容是動態加載的,需要自動下拉滾動條,加載出全部的內容,再模擬點擊下一頁加載內容。

          python培訓班分享如何用python爬取QQ說說并生成詞云圖第三步:BeautifulSoup爬取說說

          F12查看內容,可以找到說說在feed_wrap這個<div>,<ol>里面的<li>標簽數組里面,具體每條說說內容在<div> class="bd"的<pre>標簽中。

          F12查看內容

          模擬點擊下一頁加載內容

          至此QQ說說已經爬取下來,并且保存在了qq_word文件里。

          python培訓班分享如何用python爬取QQ說說并生成詞云圖第四步:詞云圖

          使用wordcloud包生成詞云圖,pip install wordcloud

          這里還可以使用jieba分詞,我并沒有使用,因為我覺得qq說說的句子讀起來才有點感覺,個人喜好,用jieba分詞可以看到說說高頻次的一些詞語。

          設置下wordcloud的一些屬性,注意 這里要設置font_path屬性,否則漢字會出現亂碼。

          這里還有個要提醒的是,如果使用了虛擬環境的,不要在虛擬環境下運行以下腳本,否則可能會報錯:

          虛擬環境下運行以下腳本可能會報錯

          我就遇到了這種情況,deactivate 退出了虛擬環境再跑的:

          生成詞云圖

          至此,爬取qq說說內容,并生成詞云圖。

          希望小伙伴們有空的時候可以試試啦。

          預約申請免費試聽課

          怕錢不夠?就業掙錢后再付學費!    怕學不會?從入學起,達內定制課程!     擔心就業?達內多家實踐企業供你挑選!

          上一篇:旅游景區如何建立網絡營銷渠道?
          下一篇:如何利用Python編寫一個拼寫糾錯器?

          達內嵌入式培訓靠譜嗎?學什么?

          如何利用Python編寫一個拼寫糾錯器?

          如何利用python生成QQ詞云圖?

          旅游景區如何建立網絡營銷渠道?

          選擇城市和中心
          貴州省

          廣西省

          海南省

          香蕉视频在线一级a做爰片免费观看视频 欧美成年性色生活片 百度 好搜 搜狗
          <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>