Parcourir la source

Update codelab.md

Hui Chen il y a 11 ans
Parent
commit
268ca4452a
1 fichiers modifiés avec 1 ajouts et 1 suppressions
  1. 1 1
      docs/codelab.md

+ 1 - 1
docs/codelab.md

@@ -32,7 +32,7 @@
 
 文档抓取的技术很多,多到可以单独拿出来写一篇文章。幸运的是微博抓取相对简单,可以通过新浪提供的API实现的,而且已经有[Go语言的SDK](http://github.com/huichen/gobo)可以并发抓取并且速度相当快。
 
-我已经抓了大概十万篇微博放在了testdata/weibo_data.txt里,所以你就不需要自己做了。文件中每行存储了一篇微博,格式如下
+我已经抓了大概十万篇微博放在了testdata/weibo_data.txt里(因为影响git clone的下载速度所以删除了,请从[这里](https://github.com/huichen/wukong/blob/43f20b4c0921cc704cf41fe8653e66a3fcbb7e31/testdata/weibo_data.txt?raw=true)下载),所以你就不需要自己做了。文件中每行存储了一篇微博,格式如下
 
     <微博id>||||<时间戳>||||<用户id>||||<用户名>||||<转贴数>||||<评论数>||||<喜欢数>||||<小图片网址>||||<大图片网址>||||<正文>