《数据科学家实用统计学》

《数据科学家实用统计学》

通过这本书,你将了解:为什么探索性数据分析是数据科学中关键的初步步骤随机抽样如何减少偏差并产生更高质量的数据集,即使是大数据如何实验设计的原则……

作者:彼得·布鲁斯

出版者:“奥莱利传媒公司”

国际标准图书编号:9781491952931

类别:电脑

页面:317

观点:909

统计方法是数据科学的关键部分,但很少有数据科学家接受过正式的统计学培训。关于基础统计学的课程和书籍很少从数据科学的角度涵盖这一主题。这本实用指南解释了如何将各种统计方法应用于数据科学,告诉你如何避免滥用它们,并就哪些是重要的,哪些是不重要的给出了建议。许多数据科学资源包含统计方法,但缺乏更深层次的统计视角。如果您熟悉R编程语言,并且对统计数据有一定的了解,那么本快速参考将以一种可访问、可读的格式弥补这一差距。通过这本书,你会学到:为什么探索性数据分析是数据科学中关键的初步步骤?随机抽样如何减少偏差并产生更高质量的数据集?实验设计的原则如何为问题提供明确的答案如何使用回归来估计结果和检测异常预测记录属于哪些类别的关键分类技术从数据中“学习”的统计机器学习方法从未标记的数据中提取意义的无监督学习方法
类别:电脑

《数据科学家实用统计学》

《数据科学家实用统计学》

在这个更新的版本中,您将深入研究:探索性数据分析数据和抽样分布统计实验和显著性检验回归和预测分类统计机器学习无监督…

作者:彼得·布鲁斯

出版者:O ' reilly媒体

国际标准图书编号:149207294 x

类别:电脑

页面:350

观点:713

统计方法是数据科学的关键部分,但很少有数据科学家接受过正式的统计培训。关于基础统计学的课程和书籍很少从数据科学的角度涵盖这一主题。本实用指南的第二版——现在包括Python和R中的示例——解释了如何将各种统计方法应用于数据科学,告诉你如何避免滥用它们,并就哪些是重要的,哪些是不重要的给出了建议。许多数据科学家使用统计方法,但缺乏更深层次的统计视角。如果您熟悉R或Python编程语言,并且已经接触过一些统计数据,但想要了解更多,那么本快速参考将以易于访问、可读的格式弥补差距。在这个更新的版本中,您将深入研究:探索性数据分析数据和抽样分布统计实验和显著性检验回归和预测分类统计机器学习无监督学习
类别:电脑

使用绿色技术的认知计算

使用绿色技术的认知计算

描述性的统计数据对于多元分布. ...实际统计数据数据科学家50个基本概念……数据科学:扩大技术领域的行动计划统计数据

作者: Asis Kumar Tripathy

出版者:CRC的新闻

国际标准图书编号:9781000337884

类别:电脑

页面:296

观点:678

认知计算是一个新课题,旨在通过数据挖掘、模式识别和自然语言处理来模拟人类的思维过程。本书重点介绍了认知计算在机器人、区块链、深度学习和无线技术等领域的应用。这本书涵盖了绿色计算的基础知识,讨论了机器人、计算机科学、无线网络和深度学习中的认知科学方法。它继续呈现经验数据和研究技术,建模技术,并提供了一个数据驱动的方法来决策和解决问题。这本书是为研究人员,院士,本科生和研究生,以及从事认知计算当前应用的行业人士而写的。
类别:电脑

数量经济学与R

数量经济学与R

一个数据科学接近维克拉姆·达亚尔…《布鲁斯与布鲁斯》(2017)通俗易懂,也是为之而写数据科学家.Kennedy(2003)有一个关于抽样的有用附录……实际统计数据数据科学家50个基本概念

作者:维克拉姆·达亚尔

出版者:施普林格自然

国际标准图书编号:9789811520358

类别:数学

页面:326

观点:304

这本书提供了定量经济学的当代处理,重点是数据科学。这本书向读者介绍了R和RStudio,并在数据分析工作流程的不同部分使用了专家Hadley Wickham的tidyverse包。在对R代码进行了温和的介绍之后,读者的R技能在“轮到你”的练习的帮助下逐渐得到磨练。数据科学的核心是数据,本书使读者能够导入和处理数据(包括网络数据)。读者很早就开始使用流行的ggplot2包来可视化数据,甚至制作基本的地图。使用R理解函数,模拟差分方程,并进行矩阵操作也包括在内。本书使用蒙特卡罗模拟来理解概率和统计推断,并介绍了bootstrap。因果推断是使用模拟,数据图,和R代码的应用程序与真实的经济例子,包括实验,匹配,回归不连续,差异中的差异,和工具变量。在本书向读者介绍时间序列数据分析与图表、模拟和例子之前,增长相关数据和模型的相互作用被提出。最后,直观地介绍了两种计算密集型方法——广义加性模型和随机森林(一种重要而通用的机器学习方法)的应用。 The book will be of great interest to economists—students, teachers, and researchers alike—who want to learn R. It will help economics students gain an intuitive appreciation of applied economics and enjoy engaging with the material actively, while also equipping them with key data science skills.
类别:数学

数据科学概论

数据科学概论

这项工作也非常适合继续教育短期课程的专业人员,以及自学课程的研究人员。

作者:劳拉·伊格尔

出版者:施普林格

国际标准图书编号:3319500163

类别:电脑

页面:220

观点:481

这本易于访问和课堂测试的教科书/参考资料介绍了新兴和跨学科的数据科学领域的基础知识。涵盖了从统计学和机器学习中采用的关键概念,图形分析和并行编程的有用技术,以及数据科学在诸如构建推荐系统或执行情感分析等任务中的实际应用。主题和特点:提供了大量的实际案例研究,使用真实世界的数据贯穿全书;通过使用Python解决数据科学问题的实际经验来支持理解;描述用于统计分析、机器学习、图形分析和并行编程的技术和工具;回顾了数据科学的一系列应用,包括推荐系统和文本数据的情感分析;提供相关网站的补充代码资源和数据。
类别:电脑

医学研究实用统计学“,

医学研究实用统计学“,

本文特别关注结果的介绍和解释以及医学研究中出现的许多实际问题。

作者:道格拉斯·g·奥特曼

出版者:CRC的新闻

国际标准图书编号:0412276305

类别:数学

页面:630

观点:634

大多数医学研究者,无论是临床的还是非临床的,在本科阶段都有一些统计学的背景知识。然而,它通常是简短的,很久以前,并在需要它的时候基本上被遗忘了。此外,许多介绍性文本未能充分解释统计学的基本概念,而且往往与开展和评估医学研究的现实脱节。实用统计医学研究是一个基于问题的文本,医学研究人员,医学生,和其他在医学领域谁需要使用统计,但没有专门的数学背景。作者借鉴了二十年的咨询医疗统计学家的经验,对关键的统计概念提供了清晰的解释,并坚定地强调了设计和分析医学研究的实际方面。本文特别关注结果的介绍和解释以及医学研究中出现的许多实际问题。
类别:数学

数据科学设计手册

数据科学设计手册

在这些领域和相关领域的从业者会发现这本书完美的自学以及。

作者: Steven S. Skiena

出版者:施普林格

国际标准图书编号:3319554433

类别:电脑

页面:445

观点:552

这本引人入胜且书写清晰的教科书/参考提供了对快速兴起的数据科学跨学科领域的必备介绍。它侧重于成为一名优秀数据科学家的基本原则,以及构建收集、分析和解释数据的系统所需的关键技能。《数据科学设计手册》是一个实用见解的来源,它强调了在分析数据时真正重要的东西,并提供了如何使用这些核心概念的直观理解。这本书没有强调任何特定的编程语言或数据分析工具套件,而是侧重于重要设计原则的高层讨论。这本易于阅读的文本理想地服务于本科生和早期研究生开始“数据科学导论”课程的需求。它揭示了这门学科如何处于统计学、计算机科学和机器学习的交叉点,具有独特的重要性和特点。在这些领域和相关领域的从业者会发现这本书完美的自学以及。其他学习工具:包含“战争故事”,提供关于数据科学如何应用于现实世界的观点包括“家庭作业问题”,为自学提供了广泛的练习和项目提供了一套完整的讲座幻灯片和在线视频讲座www.data-manual.com提供“带回家的课程”,强调从每个章节学习的大概念从在线平台Kaggle推荐令人兴奋的“Kaggle挑战”突出“错误的开始”,提供数据科学电视节目“the Quant Shop”(www.quant-shop.com)中的例子
类别:电脑

统计网络分析的概率基础“,

统计网络分析的概率基础“,

具有平易近人的阐述和50多个开放的研究问题和解决方案的练习,这本书是对现代网络分析,数据科学,机器学习感兴趣的高级本科生和研究生的理想选择。

作者:哈里·克兰

出版者:CRC的新闻

国际标准图书编号:9781351807333

类别:商业与经济

页面:236

观点:540

《统计网络分析的概率基础》对现代网络分析的基本原则和主要挑战提出了一个新鲜而深刻的观点。其清晰的阐述为理解可交换和动态网络模型、网络抽样和网络统计(如稀疏性和幂律)背后的基本思想提供了必要的背景,所有这些都在当代数据科学和机器学习应用中发挥着核心作用。这本书让读者对统计推断的基本原理、网络数据的经验属性和概率论的技术概念之间微妙的相互作用有了清晰而直观的理解。它在数学上严谨,但非技术性的阐述使专业的数据科学家、统计学家、计算机科学家以及实质性领域的从业者和研究人员都可以阅读这本书。新手和非定量研究人员将发现它的概念方法对于从统计和概率发展关于技术思想的直觉是非常宝贵的,而专家和研究生将发现这本书对于广泛的新主题是一个方便的参考,包括边缘可交换性,相对可交换性,图元和图元模型,以及图值Levy过程和动态网络的重布线模型。作者精辟的评论补充了这些核心概念,挑战读者超越这一新兴学科目前的局限。有一个平易近人的阐述和50多个开放的研究问题和解决方案的练习,这本书是对现代网络分析,数据科学,机器学习和统计学感兴趣的高级本科生和研究生的理想选择。哈里·克兰是罗格斯大学统计学和生物统计学研究生项目的副教授和联合主任,也是哲学研究生院的副成员。克兰教授的研究兴趣包括网络科学、概率论、统计推理和数学逻辑等一系列数学和应用主题。除了他在边缘和关系互换性、相对互换性和图值马尔可夫过程方面的技术工作外,Crane教授的方法还被应用于外交政策研究所和RAND的空军项目的特定领域的网络安全和反恐问题。
类别:商业与经济

非结构化文本数据应用的实用文本挖掘和统计分析

非结构化文本数据应用的实用文本挖掘和统计分析

获得2012年散文奖在计算和信息科学从美国出版商协会,这本书提供了一个全面的如何参考,显示用户如何进行文本挖掘和统计分析…

作者:加里·米纳

出版者:学术出版社

国际标准图书编号:9780123870117

类别:数学

页面:1000

观点:815

非结构化文本数据应用程序的实用文本挖掘和统计分析汇集了专业人员有效使用文本挖掘应用程序和统计分析所需的所有信息、工具和方法。2012年美国出版商协会计算与信息科学散文奖得主,这本书提供了一个全面的操作参考,向用户展示如何进行文本挖掘和统计分析结果。除了深入研究核心文本挖掘和链接检测工具、方法和操作外,本书还研究了先进的预处理技术、知识表示考虑因素和可视化方法。最后,本书探讨了当前的现实世界,文本挖掘和链接检测的关键任务应用,使用现实世界的示例教程,在企业、金融、商业智能、基因组学研究和反恐活动等不同领域。世界上包含着难以想象的大量数字信息,这些信息正以越来越快的速度变得越来越大。这使得许多以前无法做到的事情成为可能:发现商业趋势,预防疾病,打击犯罪等等。如果管理得当,这些文本数据可以用来解锁新的经济价值来源,为科学提供新的见解,并让政府承担责任。随着互联网的扩展,我们处理其中包含的非结构化文本的自然能力下降,文本挖掘在信息检索和搜索方面的价值将急剧增加。大量的案例研究,大多数以教程格式,允许读者使用软件程序“点击”示例,从而学习以最快速的学习方式进行文本挖掘分析。大量的示例,教程,幻灯片和数据集可通过Elsevierdirect.com的配套网站获得。附录中提供了文本挖掘术语的术语表
类别:数学

模式识别与机器学习

模式识别与机器学习

这是关于模式识别的第一篇文章,提出了贝叶斯观点,在过去的五年里变得越来越流行。

作者:克里斯托弗·m·毕夏普

出版者:施普林格-

国际标准图书编号:0387310738

类别:电脑

页面:738

观点:469

这是关于模式识别的第一篇文章,提出了贝叶斯观点,在过去的五年里变得越来越流行。它提出了在精确答案不可行的情况下允许快速近似答案的近似推理算法。它提供了第一个使用图形模型来描述概率分布的文本,而没有其他书籍将图形模型应用于机器学习。这也是第一本关于模式识别的四色书。本书适用于机器学习、统计学、计算机科学、信号处理、计算机视觉、数据挖掘和生物信息学等课程。为课程教师提供广泛的支持,包括400多个练习,根据难度分级。部分练习的示例解答可从本书的网站上获得,而其余的解答可由教师从出版商处获得。
类别:电脑