新鹿鼎记理科生韦小宝第230章 沐剑屏曾柔数据处理员
阿珂在织造局的成功“亮相”如同一次精准的品牌营销不仅为新式纺机扫清了部分人为障碍更在无形中提升了韦小葆及其技术总局在传统衙门眼中的“格调”。
外部公关初战告捷韦小葆便将目光收回投向内部日益庞大的信息流。
技术总局的各个项目、遍布东南的商行网络、乃至开始尝试推行新农政的试点州县每日都在产生海量的原始数据——田亩产量记录、物资消耗清单、市场物价波动、人口丁银数目、工坊产出报表……这些数字如同散落的珍珠蕴含着揭示规律、发现问题、优化决策的巨大价值但若无人整理分析便只是一堆杂乱无章的废纸。
这一日韦小葆抱着一大摞刚刚从福建驿站送来的卷宗走进了书房旁特意辟出的一间小室。
这里原本是间小书房如今被双儿布置成了“数据处理中心”。
两张宽大的书案并排而放上面整齐地摆放着算盘、各色笔墨、直尺、圆规以及一叠叠空白的格纸。
沐剑屏和曾柔正坐在案后一个在核对账目一个在练习韦小葆教的阿拉伯数字和简易演算符号。
“剑屏曾柔有新课业了。
”韦小葆将沉重的卷宗放在空着的桌面上发出“咚”的一声闷响。
两位少女抬起头沐剑屏眼中带着好奇曾柔则更多是跃跃欲试。
她们被赋予“数据处理员”的职责已有一段时日初步掌握了韦小葆灌输的统计基础正渴望着实践。
“这是福建布政使司送来的关于泉州、漳州两府试行‘一条鞭法’与推广新式稻种后的第一年赋税与粮产汇总。
”韦小葆拍了拍那堆卷宗“里面的数据记录方式……嗯比较传统。
” 沐剑屏拿起最上面一本翻开一看只见里面是用工整的毛笔小楷记录的流水账: “泉州府晋江县万历坮下田三百二十亩原征米……” “漳州府龙溪县王家庄户丁一百零三实缴银……” 条目繁多格式不一有的按田亩有的按人丁有的州县甚至还将实物赋税(如丝、绢)也混杂其中看得人眼花缭乱。
“相公这……如此杂乱如何能看出成效与否?”沐剑屏秀眉微蹙她出身沐王府对政务不算陌生但面对如此原始的数据也感到无从下手。
曾柔也凑过来看她心思更细指着其中一处说:“你看这里龙溪县上报的垦荒田亩数与后面统计的增收粮赋似乎对不上比例。
” 韦小葆赞许地点点头:“发现问题了?这就是数据不规范、不关联的弊端。
我们的第一步不是直接分析而是‘数据清洗’与‘标准化’。
” 他拿起炭笔在一张大的白纸上画了起来:“首先我们要设计统一的表格。
横向可以定义这些字段:府、县、年份、数据类型(如人口、田亩、粮产、赋税银、赋税米…)、具体数值、备注。
纵向就是每一条记录。
” 他一边说一边画出表格的雏形:“剑屏你负责将这些卷宗里的原始数据按照我们设计好的表格重新誊录。
注意所有单位要统一比如田亩统一用‘亩’赋税银统一用‘两’遇到石、斗等容量单位要按标准换算。
遇到明显不合理的数据比如某县人均占地百亩或者粮产高得离谱先用特殊符号标记出来我们后续核实。
这个过程叫做‘数据清洗’目的是得到干净、规整、可计算的数据集。
” 沐剑屏看着韦小葆画出的清晰表格眼睛亮了起来。
她本性喜欢条理分明的事物这繁琐的誊录工作在她看来如同将乱丝理成顺线颇有意义。
“我明白了相公。
便是要将这些散乱记载分门别类填入格中使其整齐划一。
” “正是。
”韦小葆又看向曾柔“曾柔你的任务更重要一些。
等剑屏将部分数据整理出来你需要进行计算和分析。
比如计算各府县的平均亩产与推行新稻种前的旧数据进行对比计算增长率;计算人均赋税负担的变化;还可以尝试计算田亩、人口与总赋税之间的相关系数……” 他引入了一些简单的统计概念:“比如我们可以算一下推行新法后赋税折银征收对官府财政收入的实际增加额是多少?是所有的县都增加还是有的增有的减?那些减少的县有什么共同特点?是山地多?还是灾害多?这些都需要从数据里找答案。
” 曾柔听得极为专注她对于数字和计算有种天生的敏锐。
韦小葆教的“平均数”、“增长率”等概念她理解得很快。
“相公是说通过这些数字的加减乘除比较大小就能看出新政是好是坏哪里好哪里不好?” “不错!数据不会说谎但它会隐藏真相。
我们的工作就是通过合理的整理和计算让真相浮现出来。
”韦小葆肯定道。
接下来的日子这间小小的“数据处理中心”变得异常忙碌。
沐剑屏埋首于卷宗之中耐心地将一条条原始记录转换成表格里工整的数字和文字。
她不时会遇到难以辨认的字迹、前后矛盾的记录或者明显不合逻辑的数字都会仔细标记或者与曾柔讨论偶尔还会去请教苏荃确保誊录的准确性。
这项工作极大地锻炼了她的耐心和细致。
本小章还未完请点击下一页继续阅读后面精彩内容!。
本文地址新鹿鼎记理科生韦小宝第230章 沐剑屏曾柔数据处理员来源 http://www.hnzgly.com





