俞木發

網站和微信公眾號是大家瀏覽文章經常去的地方,下面分別介紹相應的采集方法。
1.采集網站中的文章
對于普通網頁中的文章,我們可以使用“水淼萬能文章采集器”來采集(https://www.shuimiao.net/ArticleCollection/,支持免費試用,每次可采集20篇文章)。比如現在需要采集與“人工智能算法”有關的文章,啟動該軟件后在搜索框中輸入關鍵詞“人工智能算法”,“搜索引擎”選擇“百度網頁”,然后點擊“開始采集”按鈕(圖1),稍后它就會將包含該關鍵詞的頁面下載到本地保存(正文為空,或者不足200字的頁面會自動跳過)。
以后我們只要打開默認的保存位置“C:\關鍵詞采集\指定關鍵字”,就能在其中看到所采集的文章了。這些頁面是離線保存的,大家可以根據自己的實際需要慢慢地進行整理(圖2)。
2.采集微信公眾號內的文章
現在有很多高質量的文章保存在微信公眾號內,如果想采集其中的文章,我們可以借助WeChatDownload這款工具(https://priapus.lanzoui.com/i6Szeipeure)來完成,這里以采集“電腦愛好者”微信公眾號內的全部文章為例進行說明。啟動WeChatDownload后切換到“設置中心”選項卡,勾選“微信文章全部下載”選項,“下載范圍”選擇“全部”。其他的選項,如是否下載音頻文件、是否下載為Word文檔(方便后續編輯)等按需選擇即可。設置完后點擊“應用配置”按鈕(圖3)。
接著關閉該軟件并重新啟動它,在彈出安裝證書提示時點擊“是”。進入程序的主界面后啟動電腦版微信,打開“電腦愛好者”公眾號的歷史文章界面,這時WeChatDownload會自動讀取歷史文章列表,讀取完后就會自動開始采集文章了(圖4)。
采集到的文章默認保存在“WeChatDownload的安裝目錄\application\電腦愛好者”中(圖5),以后可以隨時打開該目錄查看它們。

現在手機的性能非常強大,有很多朋友經常使用手機瀏覽文章,同樣有不少APP能幫助我們快速完成采集工作。
1.網頁文章的采集
如果需要采集網頁中的文章,可以使用手機端Edge瀏覽器來離線保存頁面。比如現在需要將電腦愛好者網站中的某篇文章保存到手機中,在手機瀏覽器中打開該文章的頁面后,用手指在頁面的任意位置處下滑,接著點擊“下載網頁”按鈕(圖6)。
這樣當前頁面中的內容會自動保存為離線副本,以后如果需要查看下載到的文章,點擊圖6所示窗口中的“下載內容”,然后點擊下載列表中的文章名稱即可(圖7)。
2. 采集微信公眾號或微博中的文章
如果需要采集微信公眾號或微博中的文章,可以借助“印象筆記”APP來完成,以采集微信公眾號中的文章為例。在公眾號中打開一篇文章后依次點擊右上角的“…→復制鏈接”。接著啟動“印象筆記”APP,它會自動從剪貼板中讀取復制到的鏈接,之后點擊頁面中的“保存”按鈕,即可將保存的鏈接轉換為筆記(圖8)。

轉換后的筆記默認保存在“我的筆記→筆記本→我的剪貼板”中,打開該目錄即可進行瀏覽、編輯和分類等操作(圖9)。此外,我們還可以使用“印象筆記”的歸檔(對文章進行分類)、編輯、搜索等功能進一步管理采集到的文章。

在不同的時間段我們往往會使用不同的設備來閱讀文章,比如在公司時用電腦,而通勤時用手機等。另外,手機平臺又有Android和iOS之分。因此為了更方便大家采集文章,最后筆者再介紹一些支持全平臺的收藏方法。

1.利用微信收藏文章
微信現在已經成為很多人必裝的一款工具,當我們瀏覽網頁時,如果需要收藏文章,依次點擊“分享→添加到微信收藏”即可(圖10)。這樣以后無論是在手機中還是電腦中,只要登錄自己的微信賬號就能在“收藏”中找到保存的文章鏈接,之后再參照上文介紹的方法進行采集即可(圖11)。


2.利用Automate自動收藏文章
Automate是一個支持自動化操作的手機APP,我們可以通過設置一個自動收藏文章的腳本來實現文章的自動收藏。以將文章自動收藏在“https://www.instapaper.com”網站為例,我們先登錄該網站并注冊一個新用戶,接著啟動Automate,點擊界面中的“+”新建一個工作流,依次添加“flow beginning→getc l i p b o a r d c h a n g e →f o r k→f x函數[具體代碼為:ma tc h e s (s h a r e _t e x t , " ( ? m s ) . * h t t p s ? : / / w w w .instapaper.com/api/add)]”,輸入完后進行保存(圖12)。

這樣,以后需要在瀏覽器、微信公眾號或其他APP中收藏文章時,只需在對應的功能菜單中選擇“復制鏈接”,文章鏈接就會自動保存在“ht t p s: //www.instapaper.com”網站中了。同理,再通過電腦或手機訪問該網站并進行采集即可。