数学建模社区-数学中国

标题: [数据资源]Web信息抽取数据集 [打印本页]

作者: 衫衫学长    时间: 2016-8-30 17:21
标题: [数据资源]Web信息抽取数据集
本帖最后由 衫衫学长 于 2016-8-30 22:02 编辑 / Z" G, G% M- ?& c4 c
2 C' Y% ]3 ?6 a' M% O5 F& Q9 }

( I- W+ B6 B* V! l( S
2 k( ^( a; {; D9 N; w$ v* r2 a- X5 t' D* E; z2 h6 Y' S) h/ e( D
* \# `4 b( f6 b6 ?; a
9 }1 v9 Z6 @9 |0 O. s+ H
为了鼓励国赛的同学,尽力分享之前收藏的一些数据文件和各种文献。( i, g( B- R9 l; a
--------------------------------------------------- C+ y) s( _8 x0 P" g  c+ l) D1 h6 D' c

8 I& v$ u2 L3 d8 \
数据名称:Web信息抽取数据集1 d# }# o7 T7 T" I3 d7 R
数据集是从http://www.completeplanet.com 上爬取的网页。其中包含超过4000个的深层网络,超过2万个的web页面和超过30万条结构化的数据,可用于web上结构化数据的抽取。
: z* g5 C+ p$ G! O QQ截图20160830165428.png
( H& K: M7 J* M4 [9 G, Z9 z! r7 g
版权信息:如果您的论文或者项目/课题使用了本数据,请在相关数据引用中说明:数据来自于WAMDM实验室。
$ e- J( R8 b7 n: T- j$ X1 }) ^: s  [4 j
Web信息抽取数据集 下载方式和说明.txt (344 Bytes, 下载次数: 19, 售价: 10 点体力) + e8 I1 o: B8 n* h: X

: p( _+ ~" U" v% X9 H, P* l+ j/ ^  W4 q3 X

% l( \+ e3 v) K- r( c5 S
( V3 b+ y# j6 B- u
3 V0 A. I5 K; m' [% H
作者: 吃苹果的梨    时间: 2016-8-31 09:43
666666666666666
5 p. `' f4 a8 K; {, `
作者: 孔孟圣人    时间: 2016-8-31 14:21
66666666666( ~# u6 y, e4 s/ T* ]& y3 {& G( P$ d

作者: A_lice    时间: 2016-8-31 15:07
谢谢楼主分享
7 k: d1 E# r% R+ y
作者: 王长安    时间: 2016-8-31 15:38
谢谢分享。4 e1 q% B% Z8 d9 j( T$ M: d& A# ]

作者: 1731498896    时间: 2016-8-31 15:45
谢谢楼主分享,很受用: ^( D3 e( X) q; o; v9 N9 a+ G

作者: easonmathe    时间: 2016-8-31 16:34
创意平板折叠桌特等奖论文. r2 G  I  D- k3 U

作者: chq130    时间: 2016-8-31 17:52
这究竟做什么 用的) V9 m0 V  z: `4 z* L8 H. i

: L& U3 B* s" _8 f+ r




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5