大数据分析:解释Deped的预算数据中的异常值


<p>作者:Wilson Chua使用来自Deped.gov.ph网站和大数据描述性分析的数据,我们尝试识别数据中的异常值,异常和印刷错误</p><p>正如您在前一篇文章中所记得的那样,虽然P值小于5%,并且在视觉上趋势线适合数据点,但图中存在异常值</p><p>什么可以解释这些异常值</p><p>更重要的是,我们如何帮助DepED快速识别重点学校的数据以进行重新审核</p><p>让我们使用一个名为每个学生预算的指标</p><p>为了达到这个指标,我们将分配给学校的预算除以在该学校注册的学生人数</p><p>该过程包括从每所学校的Deped获取入学人数,并根据[SchoolId]字段将其与为每所学校分配的实际预算相匹配(链接)</p><p>然后,我们按降序对结果度量进行排序</p><p>这将产生一个排名的学校列表,每个学生的预算分配最高</p><p>统计异常将迅速走向极端:到顶部并向下漂移</p><p>然后,我们将结果显示在下面的条形图中,其中学校列在左侧,条形图显示该学校的每位学生的平均预算</p><p>然后按降序对其进行排序,以帮助简化分析</p><p>我们进一步以黑色垂直线的形式添加全国平均线</p><p>如果只有4名学生,东萨马尔圣朱利安的Layog PS如何获得68,000的预算</p><p>那么这里更多,这次比较高中学生的每个学生的预算:看看Pangasinan的Sta Barbara的Daniel Maramba国立高中,我们发现每个学生的预算分配排在第三位</p><p>显然,他们的预算为3,699,000.00,仅约137名学生</p><p>这使学校的每名学生的平均预算非常高,约为27,000比索</p><p>然而,与学校校长的快速检查表明,他们有2015年至2016年的2,734名(非137名)学生</p><p>显然这是一个印刷错误</p><p>列表顶部的其他学校很可能也是类似印刷错误的结果</p><p> Deped可能值得寻找并解决这些错误</p><p>另一方面,也有一些入学人数没有[schoolIds]或零预算:访问交互式分析以了解更多详细信息</p><p>查看我的其他大数据分析帖子:http://www.mb.com.ph/big-data-getting-employment-trends-without-dole-stats/ http://www.mb.com.ph/big -data-google-and-dengue-tracking / http://www.mb.com.ph/using-big-data-for-small-business-loans/标签:大数据,大数据分析:解释Deped的异常值预算数据,DepED,马尼拉,马尼拉公告,马尼拉新闻,今日新闻本文错过了我的几个图表</p><p>要查看完整的文章,请访问:https:
  • 首页
  • 游艇租赁
  • 电话
  • 关于我们