7月13日,位于北京海淀区的数据堂公司办公场所。新京报记者 李云琦 摄

  百度、华为、三星等现身公司前五大客户;“界定不清”的部分业务已经关停;公司称目前正常经营

  时隔一年,新三板挂牌公司数据堂牵涉其中的侵犯公民信息案终于审结。7月11日,数据堂发公告称,公司某一客户因出售公民个人信息被公安机关调查,公司个别相关人员牵连涉案接受调查。2018年5月9日、7月10日,该案两次开庭审理完毕,尚待宣判。

  一直自称新三板“数据第一股”的数据堂,是一家数据市场服务提供商,主要业务涵盖数据采集、制作、交易等。2017年5月,数据堂就被媒体爆出牵涉信息泄露、高管被抓、公司经营异常等问题。

  7月13日,新京报记者来到位于北京中关村的数据堂总部,工作人员告诉记者,公司目前经营正常。公司前台告诉记者董事长、董事会秘书均在出差,将会联系董秘给记者回电话,但截至7月15日发稿,记者一直未接到相关回复。

  

  牵涉个人信息泄露案,公司正常办公

  记者13日来到北京中关村数据堂的总部探访,看到数据堂公司正常办公。

  当记者问及公司涉及的信息泄露一事,前台员工对记者说,“这个事情很多天了,他们(高管)也没太大的反应”,“大家都知道什么情况,所以说没事的。”

  该员工告诉记者,公司董事长、董事会秘书正在出差,没有办法接受采访,其承诺会联系董秘让其给记者回电,截至发稿前,记者没接到相关电话。

  7月8日新华视点报道称,山东临沂警方接到群众举报,辖区QQ群里有人兜售公民个人信息。警方查明该案涉嫌侵犯数百亿条个人信息,11家公司涉案,其中有3家公司涉嫌单位犯罪。案件涉及的数据隐私性高,包含了手机号、上网基站代码等40余项信息要素,甚至部分数据能直接进入公民个人账号主页,危害巨大。

  报道显示,数据堂在8个月内日均传输公民个人信息1亿3千万余条,累计传输数据压缩后达4000GB左右。该视频新闻有镜头显示,身穿制服的警察出现在有数据堂标志的办工场所中进行检查。

  数据堂7月11日发公告称,该案是公司某一客户因出售公民个人信息被公安机关调查,公司个别相关人员牵连涉案接受调查。

  “涉及业务为公司已经关停的零星非主营业务,不会对公司主营业务构成重大不利影响”,数据堂在公告中称。

  数据堂称,公诉中数据堂未被列为被告,该案已于2018年5月9日和7月10日两次开庭审理完毕,均未宣判。

  众包采集信息,0.2元就能买一条病例信息

  数据堂在2014年成功挂牌新三板,此后便以“数据第一股”自居。记者在数据堂看到,公司里挂着“大数据共享交易和众包服务平台”“大数据运营中心”等字牌。

  数据堂涉及的数据种类非常多。在2016年年报中,数据堂称拥有超过2000TB的数据,涵盖金融、信用、医疗、交通等数十大领域的大规模数据。简单来说,人们发布的每一条微博,在互联网公开上传的每一张照片,发布的每一条评论,都有可能成为数据堂数据交易及应用平台上的信息。

  数据堂是如何获取这些信息的呢?

  除了一些公共机构公开共享和通过技术手段在网络采集外,数据堂获取数据的来源还包括通过众包采集和供应商提供。

  新京报记者了解到,数据堂曾经开发了一款APP,就是通过众包的方式来获取到自己想要的数据。这款名为“众客堂”的APP,主要是用来下发数据堂所需要的数据任务,再由个人或者团队进行声音、图像、文本等数据的采集,并通过该APP上传,最终获得相应报酬。

  7月15日,新京报记者安装了众客堂APP,在任务中心看到,众客堂发布的采集任务包括人脸照片采集、不同国家的语音采集、我国不同地区方言的语音采集、车辆行驶信息采集等,参与这些采集任务的人数有的能达到好几千人。

  在一项个人就能参与的“病例图片采集”任务中,需要任务执行者用手机拍摄病例并上传,要求病例内容拍摄完整且必须是手写。对于病例的来源等,任务并没有提出具体要求。

  记者注意到,每上传一张病例图片,审核通过后能获得0.2元的报酬,该条任务下的信息显示,已经有3196人参与了该任务。

  这样的众包采集数据堂很早就有,据数据堂众包网站介绍,2012年2月,其就推出“发数据,得堂币”活动。但“众客堂”APP在应用系统中显示的最新更新时间是2017年9月,部分对应的链接点击进去显示为“停机维护”,记者无法确定该平台是否仍然在运行。

  去年亏损扩大近5倍,百度、华为等是大客户

  7月11日,数据堂公告中称,公司已对涉案业务予以整改和停止,并对相关业务进行了梳理。

  数据堂旗下主要有AI线、营销线、金融线、财经线4种产品类型。2016年,这4种产品类型的收入占比分别为50.40%、0.39%、18.62%、30.59%。到了2017年,上述4类产品的收入占比变为75.66%、0.71%、12.19%、11.44%。

  2017年,数据堂对金融线、营销线的业务均予以关停,这些业务涉及的资产包括预付账款370万元、存货3546万元、固定资产85万元,上述处理对公司合并报表层面的利润总额影响4001万元。

  四项产品中关停两项,让数据堂2017年业绩大幅下滑。2016年数据堂净利润为-1693.55万元,2017年这一数字为-9776万元,亏损扩大了将近5倍。

  “但凡界定不清的业务均予以关停,使公司上下游客户均有所减少,业务规模受到较大影响”,数据堂在2017年年报中这样解释。

  部分业务的关停,也改变了数据堂的发展策略。此前数据堂称,2018年公司将专注于人工智能大数据领域的业务,不断加大在该领域的投入。

  值得注意的是,近年来数据堂的前五大客户中,还常常出现华为、百度、三星、谷歌、腾讯等公司的身影。2017年前五大客户中,对华为、百度、三星、谷歌的销售占比分别达到了9.487%、6.744%、4.837%、4.659%。

  此外,数据堂还曾与淘宝签订《中英文语音数据》协议,为阿里巴巴集团提供中文手机语音、英文手机语音、粤语手机语音等数据;与搜狗签订《海量语音数据处理》协议,为搜狗科技提供海量语音数据处理解决方案。

  截至2018年3月底,数据堂总资产为2亿元,归属于挂牌公司股东的净资产为1.9亿元。今年一季度,公司营业收入为1488万元,净利润为-200万元。

  新京报记者 李云琦

  liyunqi@xjbnews.com