法律实务爬虫技术应用涉刑犯罪的类型化研究

福建白癜风医院 https://m-mip.39.net/baidianfeng/mipso_4885172.html

以下文章来源于百君律师事务所,作者李晓磊律师、李豪实习生;本文版权归作者所有,转载仅供交流学习,如有异议请私信联系删除

引言

在数字经济社会,数据蕴含的巨大商业价值,如何有效提取数据成为一个挑战。于是,网络爬虫技术应运而生。那么,何为网络爬虫技术?

网络爬虫(WebCrawler),通常是指一种按照一定的规则,自动地抓取万维网信息的程序或者脚本的技术。另外,也有人称之为网页蜘蛛、网络机器人、蚂蚁、自动索引、模拟程序或者蠕虫等。

因此,网络爬虫技术本质上属于一种数据收集技术,可以在未经数据主体许可下访问或获取大量数据。其运行需要依赖一套高效的下载系统,针对目标网页的信息数据,高速下载到本地并形成在线网页镜像备份。你可以将其想象成一个二十四小时不间断地访问各种网站,并带回与站点相关的信息同时能自动提取一些数据的“人”。

然而,爬虫技术的滥用容易引起一系列侵犯数据、信息系统等等现象的发生,这些现象不但涉及民事侵权、不正当竞争,而且有引致刑事犯罪的法律风险。本文以61起相关涉刑案例为样本,对其进行类型化分析研究。

一、网络爬虫技术应用现状之描述

(一)网络爬虫技术的常见应用场景

目前从网页交互维度来看,网络爬虫分为两种主要方式,分别是常规爬虫和自动化爬虫。常规爬虫必须要要知道所爬取的每个页面的具体位置,而且只能逐个网页爬取,不能整站爬取;自动化爬虫能模拟大部分的用户操作,因此只需知道一个网站的首页地址就可以爬取整个网站的数据。

网络爬虫技术常见的应用场景有:一是抓取网页数据,例如比价网站,通过爬虫技术获取到各大电商平台的商品价格,再集中整理。二是热搜排行、舆情追踪也通过爬虫技术获取用户浏览的新闻关键字,再进行统计排列。三是利用爬虫技术抢票也十分常见。四是搜索引擎的优化,例如百度、谷歌都利用爬虫技术将各个网站最新的页面搬取下来,通过召回排列,再展现给用户。五是在反盗版措施中也常常利用爬虫技术来追踪盗版视频网站,以达到保护自身的知识产权。

(二)网络爬虫技术涉刑案件的实证分析

我们通过在中国裁判文书网以“爬虫”为关键词检索,共检索出刑事案件84件,排除与本文章研究主题无关的案件,实得可研究案例61件。从案由分布来看,发现集中分布在对个人数据的侵犯和利用窃取数据进行财产型犯罪。

主要涉及侵犯公民个人信息罪(19件)、诈骗罪(10件)、制作、复制、出版、贩卖、传播淫秽物品牟利罪(6件)、非法获取计算机信息系统数据、非法控制计算机信息系统罪(5件)、盗窃罪(3件)、破坏计算机信息系统罪(3件),其他种类的犯罪较少(详见图1)。爬虫技术涉刑犯罪罪名分布较为多样,侧面反映出爬虫技术相关犯罪具有手段多样、侵害法律利益复杂的特点。它不仅侵犯公民的个人信息,干扰计算机信息系统的正常运行,而且干扰国事网站的正常访问。在利用爬虫技术时除了手段和目的的合法性面临众多风险,在技术上也可能因为爬虫技术使用过于频繁而导致服务器负荷过大,进而导致计算机信息系统遭到破坏。

图年至年(截至6月20日)爬虫涉刑案件案由分布

从案件数量来看,呈现出逐年增长但近两年有所减缓的态势(详见图2)。年2件、年2件、到年1件、年2件、年11件、年16件、年24件、年9件、年1件(截至年6月19日)。不难发现在年之前爬虫技术涉刑的案件较少,而从年开始出现一个短暂的高速增长时期,但在年出现骤降,这可能与年通过的《个人信息保护法》有关。

图2爬虫涉刑案件年至年(截至6月20日)数量图

对此,我们通过梳理不同场景下应用爬虫技术涉刑的种类,就爬虫技术应用涉刑问题进行类型化研究。除了利用爬虫技术本身实施犯罪行为之外,根据中国裁判文书网检索结果来看,不少犯罪行为都是以爬虫技术为手段而进行,例如“侯某某、陈达开设赌场案”中,被告人宋某利用自己编写的“爬虫软件”抓取某境外赌博网站的比赛结果、盘口信息等,然后导入平台数据库供平台控盘人员参考,其行为就是利用爬虫技术而进行其他种类的犯罪。

从上述两个角度来看有关应用爬虫技术的涉刑案件可以初步分为直接利用爬虫技术实施的信息网络犯罪活动和利用爬虫技术实施其他种类犯罪的犯罪行为。

二、直接利用爬虫技术进行信息网络犯罪之行为

在这一类型的犯罪行为中被告人通常是将爬虫技术作为其犯罪的最主要工具,违反相应的授权协议,或者超越授权协议的范围,非法获取数据并加以不当使用构成刑事犯罪的行为。

(一)爬取用户个人信息场景下的涉刑分析

通过在中国裁判文书网全文检索“爬虫”和“公民个人信息”,共检索出19起侵犯公民个人信息罪案件和1起起出售、非法提供公民个人信息罪案件。

在20起爬取用户个人信息场景下的案件中,17起案件是利用爬虫技术主动爬取各大网站或借贷平台,例如淘宝、京东、天猫等,来获取包括姓名、手机号码、地址等在内的公民个人信息。在这17起侵犯公民个人信息罪案件中,大部分被告人在窃取到公民个人信息之后,都会以直接售卖的方式来获利。值得注意的是,在“被告人周华侵犯公民个人信息案”中,被告称自身是为其私自研究程序所需而获取公民个人信息,使用自己编写的爬虫程序窃取了4万余条学生信息,将其转存在自己的服务器之后便公布了服务器地址,使不特定人都能访问其服务器。因此在应用爬虫技术侵犯到公民个人信息时,似乎并不考虑被告人的主观故意性。

同时,在17起侵犯公民个人信息罪中,有5起案件都是涉及数据科技公司中相关技术人员操作不当或不当处理。例如,在“李威侵犯公民个人信息案”中,被告人李威系某资产管理有限公司区域经理,在任职期间利用公司内网,通过爬虫软件获取到全北京客户信息之后,再将其发送给其他公司管理人员。在“王小鹏、薛凯鹏、张涛等侵犯公民个人信息案”中,北京万界数据科技有限责任公司在进行公民个人信息修复业务时,其内部工作人员多次利用爬虫软件获取到用户个人信息之后再提供给下游技术人员进行修复业务。综上所述,上述两个案件中,个人信息处理者在对公民个人信息进行传输时,由于未明确告知用户,已经违反《个人信息保护法》第十七条的规定;加之数据科技有限公司处理用户个人信息数量巨大,极易触犯刑法侵犯公民个人信息罪的相关规定。

因此,从个人信息处理者角度来讲,公司应当积极开展数据合规审查,审查范围包含到整个数据生命周期,用以防范公司相关技术人员操作不当或不当处理而涉及刑事犯罪的法律风险。

(二)爬取计算机信息系统数据场景下的涉刑分析

我们通过在中国裁判文书网上检索“爬虫”“非法获取计算机信息系统数据”和“非法控制计算机信息系统”共检索出8篇相关文书,其中5起案例涉及非法获取计算机信息系统数据、非法控制计算机信息系统罪,2起案例涉及非法获取计算机信息系统数据罪,1起案例涉及提供侵入、非法控制计算机信息系统程序、工具罪。

在对比5起涉及非法获取计算机信息系统数据、非法控制计算机信息系统罪案例中被告人的犯罪目的发现:所有被告人均是利用爬虫技术从第三方获取到相关用户个人信息或相关数据之后,用于自身运营或其他使用,并未将其出售或提供给他人。例如在“马骏、张伟非法获取计算机信息系统数据、非法控制计算机信息系统案”中,马骏和张伟在加盟某教育机构后,萌生模仿其运营模式运营网络英语教育平台的想法,于是利用爬虫技术爬取某教育机构系统中的英语学习内容以此作为自己教育平台的内容。在“吴世斌、皮冠铮等非法获取计算机信息系统数据、非法控制计算机信息系统案”中,被告人非法获取汽车4S店的汽车保养信息和维修信息之后整合到自己运营的APP中。从采集数据的角度来讲,被告人的获取手法毫无疑问也是未得到授权的,甚至也是通过窃取的方式获取到的商业数据。因此,从企业运营角度来讲,在利用爬虫技术获取其他第三方数据时,并不是所有的公开数据都能随意获取,因为相关数据可能涉及知识产权、个人信息、商业秘密等。

在2起涉及非法获取计算机信息系统数据罪的案例中,案情基本上与上述涉及非法获取计算机信息系统数据、非法控制计算机信息系统罪的案例相似,不过在司法实践中,人们还是区分了非法控制计算机信息系统罪和非法获取计算机信息系统数据罪。此两罪区别的关键点在于是否达到了非法控制的程度。

非法控制,是指未经授权地控制他人计算机的行为,通常包括不妨害他人使用计算机信息系统与排除他人对计算机系统的控制能力两种情形。

所谓不妨害他人使用计算计信息系统,是指黑客或其他非法侵入者在计算机系统内植入木马,绕过了杀毒软件和防火墙;此情形下,合法用户并不会因为木马的存在而无法使用被控制的计算机;排除出他人对计算机系统的控制能力是指造成被控制计算机信息系统的合法用户无法登录,或者登录计算机后无法按照其自身意愿完成操作,而黑客或其他非法侵入者却能对受害计算机实现控制。

(三)爬虫技术破坏计算机信息系统的涉刑分析

从在中国裁判文书网上查阅到的相关案例来看,应用爬虫技术而触犯破坏计算计信息系统罪的情况分为两个情形:一是利用爬虫技术主动积极地进行破坏,直接用爬虫技术对系统进行攻击,属于主动性破坏。例如“王博一文、黄业兴破坏计算机信息系统案”,被告人利用自己编写的爬虫技术入侵到全运会系统管理后台,并对系统进行攻击,删除里该系统内大量参赛运动员及技术官员的抵离信息、酒店住宿信息、人员简要身份信息,造成严重影响。

二是在应用爬虫技术时导致计算机信息系统受影响而被破坏,通常是因为爬虫技术使用过于频繁而导致被爬虫服务器负荷过大,从而导致被爬虫服务器瘫痪,进而造成计算机系统被破坏。例如“杨杰明、张国栋破坏计算机信息系统案”,案中被告人利用爬虫技术对深圳市居住证网站的信息进行爬取,并应用于自身开发的APP中,但是因为其使用爬虫技术的频率极高,达到每秒次,致使深圳市居住证系统无法正常运作,极大地影响了该居住证系统使用方深圳市公安局人口管理处的日常运作。

三、利用爬虫技术实施其他种类犯罪的犯罪行为

(一)利用爬虫技术实施与诈骗有关行为的涉刑分析

在中国裁判文书网上我们以“爬虫”“诈骗罪”为关键词进行检索,其中一审案件共8件。从检索出的案例来看,不难发现利用爬虫技术的一方往往是上游犯罪的一方。

被告人在前期通过爬虫技术非法获取到大量的公民个人信息后,将其出售到需要实施诈骗行为的人的手中。因为掌握大量公民个人信息,其中不乏个人敏感信息,所以下游实施诈骗犯罪往往更精准,往往比传统电信诈骗更加容易得手。例如在“张国义、谢志敏等诈骗案”中,被告人李某程即利用爬虫技术获取圆通快递公司客户快递丢失件和催收件等问题件信息卖给用以诈骗的林某某。需要注意的是:在此情况下,我们一般不将利用爬虫技术获取公民个人信息的行为列入诈骗罪的共同犯罪中,而是直接以侵犯公民个人信息罪判处。

此外,也有被告人利用爬虫技术爬取的是常规数据,再利用这些数据完完全全复制一个可以以假乱真的网站,以此实施诈骗行为。例如在“徐林峰、江萧佐诈骗案”中,被告人就是以伪装正规网站为目的爬取原网站的数据,同时依靠这些数据制作一个伪装网站,再将伪装网站提供给实施诈骗的一方,来达到诈骗的目的。同样地,利用爬虫技术制作伪装网站的行为也并没有列入诈骗罪的共同犯罪。

(二)利用爬虫技术爬取特殊信息的涉刑分析

在中国裁判文书网上我们以“爬虫”和“制作、复制、出版、贩卖、传播淫秽物品牟利罪”为关键词进行检索,共检索到6起案件。以“爬虫”和“传播淫秽物品罪”为关键词进行检索,共检索到2起案件。

由于数据与知识产权的“无形财产”具有天然契合性,以数字代码形式储存、利用、传输,因而几乎所有的网络知识产权都可以被网络爬虫抓取。从诉讼案由分布来看,有关爬虫技术爬取网络知识产权的侵权大部分还属于民事纠纷,只有极少数上升到刑事的层面。不过值得



转载请注明地址:http://www.wawayuz.com/nwfz/539047.html
  • 上一篇文章:
  • 下一篇文章: 没有了