如何可靠是您可靠性数据?

“科学是我们发明的方法可以骗过自己和我们发明的方法,可以避免在愚弄自己之间正在进行比赛。1

上面的名言来自迷人的文章自然 》 杂志发表在 2015 关于科学家如何欺骗自己,他们能做什么来防止它。自然在回应一连串的文章谴责偏见、 重现性和准确性在已出版的杂志的研究。尽管原始的文章重点关注心理学和医学领域,主题是直接适用于电子领域,特别是有关执行故障分析及可靠性研究的专业人士。可靠性数据一直是极其敏感的内部和公司之间。你很少会看到可靠性数据,除非他们造成灾难性事件或结果是压倒性的积极。此外,业界更侧重于如何组织和分析数据,而不是最好的选择或生成的数据放在第一位。你可以真正依靠你看到和生成的可靠性数据吗?

如何可靠是您可靠性数据?

■ 图 1。偏见和消除偏置技术

有一定相关的偏置识别和预防课我们都应该学习和分享。例如,多少次有人要求你来分析数据只有在你开始之前,也被告知预期的结论或想要的结果?图 1 显示了几种常见形式的科学偏见以及一些消除偏置的 techniques.2,我将讨论这些技术进行了进一步详细。

第一,”偏见”一词有许多定义,内部和外部科研。我更喜欢 definition3 是偏见是任何偏差的结果或推论从真理 (现实) 或导致偏差的过程。信息周刊 》 杂志的文章总结了产业说明数据偏差的影响:”错谬数据分析得出错误结论和坏的业务成果。”4 这就是我们都想要避免的东西。这篇文章的扩大和建立上的偏见和认知谬论自然图形所示︰

  • 确认偏误︰ A 想证明某些假设,假设或意见;有意或无意
  • 选择偏倚︰ 选择非随机或非客观的数据,并不代表人口
  • 离群值偏差︰ 忽视或丢弃的极端数据值
  • 拟合和 Underfitting 偏差︰ 创建数据过于复杂或过于简单模型
  • 混杂变量的偏倚︰ 未能考虑其他可能会影响因果关系的变数
  • 非正常的偏见︰ 使用假定正态分布非正态分布数据的统计

特别是有用的另一个定义来自于美国政府一般接受政府审计标准。他们使用可靠性概念的”数据”的定义为”存在时的数据是充分完整的状态和错误免费以令人信服为其宗旨和背景”。5 数据可靠性是指的准确性和完整性的某一特定的预期用途的数据,但这并不意味着数据是错误的。可能会发现错误,但错误是在可容忍的范围之内,评估风险,并发现要精确到足以支持达成的结论。在这种情况下,可靠的数据是

  • 完整︰ 包含所有数据元素和记录所需的
  • 准确︰ 免费从测量误差
  • 一致︰ 获得和使用方式是清楚和可以复制
  • 正确︰ 反映了数据输入或计算在源
  • 不变︰ 反映了源和不被篡改

因此,不要仅仅问”是数据准确吗?”相反,问问”有我们合理信心数据提出了不是显著不同于现实的图片吗?”

进一步揭示中偏向科学数据和研究的主题是一些取得他们的任务是提高数据完整性并研究重复性的基础。两个这种组织是劳拉和约翰 · 阿诺德基金会 (LJAF),打开 Science.6 LJAF 研究诚信倡议中心力求跨越领域的范围从政府到慈善事业到个体决策提高的可靠性和有效性的科学研究。所面临的挑战是,人们相信,如果工作发表在杂志上,它是科学合理。这并不总是真实因为科学期刊有偏向于新、 小说和成功的研究。你多久读好的文章,关于失败研究?

进一步揭示中偏向科学数据和研究的主题是一些取得他们的任务是提高数据完整性并研究重复性的基础。

LJAF 促进严格、 透明、 重复性好的研究。这三原则同样适用于可靠性研究。研究应该是︰

  • 严谨︰ 随机和良好控制与足够的样本量和持续时间
  • 透明︰ 研究者解释他们打算研究,使实验的元素容易,并公布研究结果,无论他们是否证实了这个假设
  • 重复性︰ 重复工作和验证结果是一致的并可以独立转载

打开科学中心也有一个特派团前往增加公开性、 完整性和可重复性的 research.7 COS 使伟大的类比到二年级的学生在科学课的工作︰ 观察、 测试、 展示你的作品,分享。这些也是在电子行业共享的普遍价值,但是事情就辜负了这些值的方式。COS 倡导者花更多的时间花在实验设计上。这涉及到沟通的假说和设计,具有适当的样本大小,以及正确使用统计。花时间去做的事情的权利第一次阻止其他人正在沿着错误的道路。COS 还强调,只是因为研究并没有给所期望的结果或答案不使螺柱 y 毫无价值。它甚至并不意味着研究是错了。这可能意味着正在研究的问题是比可以用一个单一的实验或两个概括复杂得多。

最终,忽略数据和分析的偏见会导致灾难。哈佛商业评论发表 paper8 与案例研究说明偏见所造成的有害影响。丰田的案例研究显示异常值偏差的后果。忽略”有惊无险”,突然加速投诉急剧增加导致的悲剧。苹果 iPhone 4 天线示例阐释了不对称的注意偏差。信号强度的问题是知名和忽略,因为它是一个老问题,被容忍的市民。直到事实证明并非如此。所以,现在,我们讨论过一些很多的偏见和消除偏置技术在那里,是您的可靠性数据可靠吗?你它真实地反映了现实是多么自信?

引用

  1. http://www.nature.com/news/how-scientists-fool-themselves-and-how-they-can-stop-1.18517
  2. http://www.nature.com/polopoly_fs/7.30171.1444233846 ! /image/Reproducibility_graphic2.jpeg_gen/derivatives/landscape_630/Reproducibility_graphic2.jpeg
  3. 门,米格尔。流行病学词典。纽约︰ 牛津大学出版社,2008。
  4. http://www.informationweek.com/big-data/big-data-analytics/7-common-biases-that-skew-big-data-results/d/d-id/1321211
  5. www.auditorroles.org/files/…/Tool2aAustinCityAud_GuidanceTestingReliability.pdf
  6. http://www.arnoldfoundation.org/initiative/research-integrity/
  7. https://cos.io/
  8. https://hbr.org/2011/04/how-to-avoid-catastrophe

相关新闻