成都全搜索新闻网(记者 郭莹 朱海丹)9月3日报道 成都正在大力发展新经济培育新动能。围绕培育“六大形态”、构建“七大应用场景”,加快形成以人工智能、大数据、5G、清洁能源、现代供应链等新经济为主要形态的开放型产业体系。在“大数据+”方面,重点拓展交通指挥调度、个性化诊疗、智慧化工厂管理、大通关和物流信息服务等行业应用,推动大规模数据仓库、数据清洗、数据可视化等共性基础技术研发,到2020年大数据核心产业产值突破800亿元。
说到大数据,你首先会想到什么?是数以亿万计的数据集合?还是庞大的计算体系?很多人一听到大数据会感觉离我们的生活很遥远,但其实,大数据来源于我们生活中的方方面面,也服务与我们的生产、生活。在本期的《成都进行时》节目中,节目组探访了成都大数据实验室,通过大家熟悉的事例,来展示大数据在我们生活中的运用。
不会的选择题就选“C”?
大数据专家:其实四个选项都一样
曾经有一句在高三学子中流传甚广的考试技巧——在高考中,遇到完全不会的选择题就选“C”。这个被无数学子奉为应考“必杀技”的做题技巧,真的好用吗?我们的大数据专家来为你证明。
在国家信息中心大数据创新创业(成都)基地,成都寻道科技有限公司研发主管郭斌为我们进行了相关数据分析。
分析中,我们选取了2008年到2018年11年来的四川高考英语试题545道选择题答案作为样本,并用概率统计方法对其进行了排列分布规律分析,分析结果显示,其中A选项有139道,B选项有139道,C选项有133道,D选项有134道。从分布概率来看,A选项占25%,B选项占26%,C选项占24%,D选项占25%,四个选项的分布情况差别不大。
我们逐一对每一年选择题答案进行了单独分析,发现这11年以来,答案选C的选项出现频率最低是在2013年的四川高考英语题选择题中,为22%,出现频率最高的是2018年的四川高考英语选择题中,为29%,其余的年份的选择题C答案选项分布都比较均匀,在23%-27%之间。
另外,从题型来看,除了2008年四川高考英语试题中的语法和词汇知识题C选项占比为33%,2016年和2018年完型填空C选项占比为35%以外,其余题型C选项分布都在25%左右徘徊。
“由此可见,A、B、C、D四个答案选项分布概率都差不多,没有哪个选项出现的频率特别高。”郭斌表示,从这个分析结果可以看出,在高考出题时,出题方应该对各选项的分布都进行了综合考虑。
大数据形成“学生画像”
可预知未来还可精准扶贫
“在这个实验中,我们所运用到的是大数据分析当中最基础概率分析手段,但是真正的大数据,所涉及到的样本是万计甚至百万计的,而通过分析这些样本数据,我们可以做很多事情。”
郭斌透露,从2015年起,他们团队就在省内部分高校进行了大数据试点,“我们对学生在校的行为轨迹、消费以及进出宿舍、图书馆借阅的数据进行记录,收集到他们的生活学习各种数据。形成一个完整的“学生画像”,借助大数据分析技术,对他们进行全面的分析。”依靠这些数据,能够精准地帮扶家庭困难的学生。
成都全搜索新闻网记者了解到,到今年年底,成都市大数据产业产值将达到400亿元,年均增速49%;为了促进大数据产业发展,按照《成都市促进大数据产业发展专项政策》,成都市将实施大数据应用示范工程,引导大数据在社会管理、公共服务、经济发展、民生服务等领域的广泛应用。
此外,还将大力支持大数据实用人才培养,继续办好中国大数据应用大会、“创客中国”大数据应用大赛等全国性产业活动。围绕“西部数都”品牌,引进、策划组织一系列国际性、专业化的大数据产业展会、专业赛事和学术交流活动。最终实现到2020年产值达到800亿元,到2025年产值达到3000亿元,成都市大数据产业将带动软件和信息服务业收入超过1万亿元的目标。