裁判文书网数据竟被商家标价售卖 律师:或构成侵权

裁判文书网数据竟被商家标价售卖 律师:或构成侵权

昨天,北京青年报从某网购商城看到,最高人民法院裁判文书网的数据被标价0.1元到1元不等发售。裁判文书网发布的判决书都是公然的,为什么会被售卖?获得
裁判文书网数据的手腕对于网站是否有危害呢?

网售数据

价格需“私聊”获得

北青报记者在某网络商城中看到,有标注来自湖南、广东、山东等多地的商家均宣称
发售裁判文书网的数据,此中很多
商家宣称
其数据量超6000万条。而据裁判文书网公然数据显现,目前裁判文书网上公然的文书总量为7395万多篇,如果商家所称的数量失实,则商家可以

呐喊供应绝大多数已经公然的文书数据。

很多
宣称
可以

呐喊发售裁判文书网数据的商家在商品文字描述中称,其数据是经由过程“网络爬虫”的体式格局获得
的。所谓“网络爬虫”,又称网页蜘蛛、网页机器人,是一种依照必然的规则,自动地抓取万维网信息的程序或者剧本。相当于一个自动拜候网页并举行相干
操作的小机器人。

北青报记者注意到,尽管每名商家均在商品页面标示称,其数据售价为0.1元至1元,但每名商家均在文字描述中表示,数据的售价并不以标示为准,而是需求“私聊”获得

一名售卖裁判文书数据的商家说,购买裁判文书数据的买家所需求的数据量从几千篇到几千万篇不等,有的买家是由于无法打开裁判文书网而不得不来求助于数据卖家,“还有很多学生买数据用于论文写作,这种情形几千条就够了,商用的话也许需求几百万条以至上千万条。”商家还称,每个月他们能接到四五个文书数据采集的订单,而价格和买家需求的数据量有关,“几百万条数据大概要几千块钱,如今加密技巧很严正,以是要贵一些。”

“爬虫”零碎

曾致正常用户无法拜候

北青报记者了解到,部分技巧机关经由过程网络爬虫零碎获得
裁判文书网数据的行动
,已经给裁判文书网正常用户的拜候带来了不便。很多
网友曾在网上发帖称,自己搜索裁判文书时,常常遭遇裁判文书网网站显现由于零碎原因,无法查询的情形。

对此,最高人民法院在其官网回应网友对于裁判文书网运转慢、故障频繁等情形时表示,由于中国裁判文书网公然文书数量和影响力不竭增加,拜候用户数不竭增长。同时,2018年5月初以来,大批技巧公司经由过程爬虫零碎无限度并发拜候非法获得
裁判文书数据,形成网站负荷过大,大批正常用户请求梗塞,拜候涌现速度慢或部分页面无法显现等征象。

本年5月,最高人民法院信息中心主任许建峰在接受媒体采访时表示:“中国裁判文书网目前每天的拜候量可以达到几千万的量级,此中还包括数据爬虫的攻击,咱们的中心服务器承受着巨大压力。”

“咱们时时刻刻都在监控着它的运用情形,希望遇到问题立即采取措施,然而的确还不克不及完全跟得上步子,以是会涌现停网保护
经营的情形。”许建峰说,最高法已成立了专门的运维保障团队去保护
办理中国裁判文书网,也将在技巧与人力上投入更多的力量。

相干
机关

已采取
多种体式格局“反爬”

北青报记者得悉
,此前,相干
方面已采取多种体式格局,抗衡“爬虫技巧”。最高人民法院曾发文称,为更好地确保正常用户拜候机能,相干
方面以验证码的体式格局上线零碎软件防爬功能。“验证码技巧是防爬虫的一种有效措施,当浏览量在某段时间内达到必然数量后,将启用验证码机制举行核验。后续,咱们将不定期更新防爬虫技巧,加强网站保护
,提高网站运转效率和稳定性。”

另外
,针对网友发问
,为何不克不及依照“公然时间”为检索条件举行裁判文书检索时,最高人民法院方面表示,暂没有配置“公然时间”为检索条件的主要原因是爬虫零碎会依照“公然时间”项举行增量文书爬取,“待下一步防爬虫零碎稳定、可靠运转一段时间后,咱们将适时考虑增加‘公然时间’检索项。”

另外
,最高人民法院方面称:“由于前期爬虫行动
过于猖獗,无限度暴力拜候大幅下降正常用户拜候机能,咱们采取了经由过程限度列表页面翻页数量来预防爬虫零碎的措施。”

律师分析

强行冲破“反爬”技巧或构成犯法

金杜律师事务所从事IP类法令营业的律师瞿淼曾发文阐述了网络爬虫所涉及的法令问题。瞿淼称,从技巧中立的角度而言,爬虫技巧自身并无违法违规之处。然而,跟着数据工业的生长,数据爬取带来的各类问题和顾虑日渐增加。过于野蛮的爬虫也许形成网站负荷过大,从而导致网站瘫痪、不克不及拜候等。

“由于爬虫的批量拜候会给网站带来巨大的压力和累赘,因此许多网站经营者会采取技巧手腕,以阻遏爬虫批量获得
自己网站信息。而针对这些技巧手腕,爬虫开发者可以经由过程优化自己的代码、运用IP池等多种体式格局规避上述技巧措施,实现对网站信息的批量抓取和复制。”瞿淼说,由于网络爬虫会依照特定战略尽也许多地拜候页面,因而爬虫的运用将占用被拜候网站的网络带宽并增加网络服务器的处理开销,以至无法正常供应服务。

瞿淼认为,依照《反不正当竞争法》关于网络的相干
条款,如果网站经营者已经采取了必然的反爬虫措施,而爬虫控制者基于经营倾向、强行冲破网站经营者采取的反爬虫技巧措施,并客观导致被抓取网站无法正常运转,则也许构成不正当竞争行动
。另外
,强行冲破某些特定被爬方的技巧措施,还也许构成刑事犯法
行动

针对此情形,北京市社会组织法令调解中心副理事长张新年律师认为,“这些裁判文书基于司法公然倾向,是免费的公共资源,未经最高人民法院授权,商家售卖裁判文书网数据构成侵权。”

文/记者屈畅 朱健勇  实习生赵诣涵


更多精彩报道,尽在https://ilahitv.com