-
何为数据湖?用于大数据分析的大规模可扩展存储
所属栏目:[大数据] 日期:2022-06-26 热度:57
从那时起,数据湖技术不断发展,现在正在与数据仓库争夺大数据存储和分析的市场份额。各种工具和产品支持数据湖中更快的SQL查询,而全球三个主要云计算提供商都提供了数据湖存储和分析。甚至还推出了将治理、安全性和分析与成本更低的存储结合起来的数据湖[详细]
-
大数据如何通过销售自动化创造更多的机遇
所属栏目:[大数据] 日期:2022-06-26 热度:160
大数据技术如今在各行业领域的业务方面非常重要。销售行业是受大数据影响最大的领域之一。仅在2020年,全球各地的企业就在营销分析上花费了28亿美元,这个数字每年都在大幅增长。 这就是数据分析将发挥重要作用的地方。销售公司可以仔细查看数据,了解渠道[详细]
-
为啥云原生数据湖值得关注
所属栏目:[大数据] 日期:2022-06-26 热度:74
最近几年,数据湖正在被越来越多人提起,尽管各方对数据湖的定义并不统一,但这不妨碍企业纷纷下水实践,比如亚马逊、阿里、腾讯、华为等,都在探索建设数据湖。为何众多企业在数据湖是什么上还没有达成共识的情况下,就开始着手进军数据湖领域呢?一个可[详细]
-
几款日常的开源无代码测试工具
所属栏目:[大数据] 日期:2022-06-26 热度:122
编程语言一直是自动化测试、自动化测试人员、框架甚至工作职责中不可或缺的一部分。如果一个遗留项目已经使用了Java进行测试,该公司会为该项目寻找具备Java专业知识的人员。同样,如果新项目需要从零开始构建测试流程,那么首要考虑的事情就是团队擅长哪[详细]
-
远程访问装有GPU的电脑很不方便 如今有一个值得试试的办法
所属栏目:[大数据] 日期:2022-06-26 热度:79
由于多种原因,很多人无法将在本地存储了大量文件的电脑和软件带回家,好在有办法做到从任何地方发起高质量的远程访问,而无需额外费用。下面介绍几种经过测试的方法,实现方便地远程管理办公电脑。 DOC怎么了? 普通员工只需使用远程桌面协议(RDP协议)[详细]
-
大规模分布式计算学习引擎Ray在字节跳动NLP场景下的践行
所属栏目:[大数据] 日期:2022-06-26 热度:60
RayRTC 是字节基础架构组与字节 AML 组共同合作,在内部 RTC(Realtime Text Classification)文本训练平台上基于 Ray 进行的下一代 Serverless ML 的探索。RTC 文本分类平台是一个一站式的 NLP 服务平台,包括了数据预处理,标注,模型训练,打分,评估,[详细]
-
字节跳动数据平台技术揭晓
所属栏目:[大数据] 日期:2022-06-26 热度:164
ClickHouse作为目前业内主流的列式存储数据库(DBMS)之一,拥有着同类型DBMS难以企及的查询速度。作为该领域中的后起之秀,ClickHouse已凭借其性能优势引领了业内新一轮分析型数据库的热潮。但随着企业业务数据量的不断扩大,在复杂query场景下,ClickHouse[详细]
-
数据科学家应对的几大挑战及解决方法
所属栏目:[大数据] 日期:2022-06-26 热度:147
每天,全球各地的组织都在寻找2.5万亿字节的数据,以获得对其业务的见解和价值驱动的行动。为了实现这一目标,需要高技能的科学专家或数据科学家参与开发业务中的企业AI。在不断增长的业务领域中,数据科学家的每一个行动都有助于改进业务的功能。 下面来[详细]
-
使用Java和Python进行数据统计和剖析
所属栏目:[大数据] 日期:2022-06-26 热度:186
Java 和 Python 是当今最流行的两种计算机语言。两者都非常成熟,并提供了工具和技术生态系统,帮助我们解决数据科学领域出现的挑战性问题。每种语言都各有优势,我们要知道什么时候应该使用哪种工具,或者什么时候它们应该协同工作相互补充。 Python 是一[详细]
-
云迁移之后 企业凭什么充分挖掘数据潜力
所属栏目:[大数据] 日期:2022-06-26 热度:124
近年来,基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)等业务模式正飞速发展,也推动着云投资屡创新高。根据GlobalData的报告,2024年亚太地区云计算市场规模预计将达到1918亿美元,2019至2024年期间的复合年增长率为7.7%。 然而,云迁[详细]
-
终于有人把MPP大数据系统架构讲清楚了
所属栏目:[大数据] 日期:2022-06-26 热度:136
本文首先回顾并行硬件架构的发展,并进一步介绍基于并行硬件架构的数据库一体机系统与基于MPP架构的数据库软件系统。数据库一体机系统在银行等大型企业中采用广泛,一体机的优点是开箱即用、功能丰富、稳定、售后服务好,缺点是价格昂贵、扩展不灵活。基于[详细]
-
云数据仓库中的数据安全思虑
所属栏目:[大数据] 日期:2022-06-26 热度:131
近年来,由于云计算与云存储具有一定的廉价性和可扩展性,云数据仓库(Cloud data warehouses,CDW)得到了广泛的应用并飞速发展。同时,CDW不但能够存储比本地数据库更多的数据,而且可以通过现代化数据管道,简化了ETL的各种流程,因此许多企业都开始用[详细]
-
为何很多人宁可用 Excel 也不用 Python
所属栏目:[大数据] 日期:2022-06-26 热度:198
有人说,Python即使不是最好的编程语言,也是最受欢迎的语言之一。因为它简洁易用,功能强大,对初学者也很友好。在众多培训机构的小广告中,学了Python就能批量处理Excel表格,Python是实现办公自动化的利器,从此告别996之类的口号随处可见。但实际工作[详细]
-
大数据如何改变制造业
所属栏目:[大数据] 日期:2022-06-09 热度:200
区块链如何改变制造业 由于该领域的独家技术突破,制造业正处于一场革命之中。 制造业的大数据正在实现明智的战略,并制定未来的路线图。 制造业是在过去几十年里经历了巨大变化的行业之一。除了简单地自动化相关流程之外,制造业还利用技术实现各种其他目[详细]
-
一文读懂元数据管理!
所属栏目:[大数据] 日期:2022-06-09 热度:178
一文读懂元数据管理! 一、什么是元数据? 元数据(metadata)是关于数据的组织、数据域及其关系的信息,简言之,元数据就是描述数据的数据。概念总是生涩,对于没有IT背景的人来说比较抽象,不容易理解,下面举几个例子。 示例1:歌词中的元数据 有一首很[详细]
-
为何大厂选择减人而不是降薪?
所属栏目:[大数据] 日期:2022-06-09 热度:108
为何大厂选择减人而不是降薪? 01 前2天写了大厂裁人和招人为何同时进行的原理,后台也收到了很多有趣的私信,其中有一个问题让我觉得特别有意思。 问的是大厂为控制成本他能理解,但同样是控制成本,裁掉30%的人,以及不裁人集体降薪30%,区别是啥? 为什[详细]
-
终于有人把数据的属性讲明白了
所属栏目:[大数据] 日期:2022-06-09 热度:98
终于有人把数据的属性讲明白了 1.结构化与非结构化数据 某些数据集具有很好的结构性,就像数据库中的数据表或电子表程序中一样。而其他的数据以更多样的形式记录着有关世界状况的信息。它们可能是像维基百科这样包含图像和超级链接的文本语料库,也可能是[详细]
-
价值变现的关键是组织优化和数据治理
所属栏目:[大数据] 日期:2022-06-09 热度:53
大数据、数据治理、数据湖以及目前被热议的数据中台概念,无不让企业信息化部门疲于跟进,而不是根据企业的实际情况决定建设节奏。企业A的IT部门,就曾受到业务部门要求建设数据中台的压力,但迟迟难以下决心启动数据中台项目。 从A企业的视角来看,目前,[详细]
-
反映数据质量的八个指标
所属栏目:[大数据] 日期:2022-06-09 热度:137
数据的质量直接影响着数据的价值,并且还影响着数据分析的结果以及我们依此做出的决策的质量。质量不高的数据不仅仅是数据本身的问题,还会影响企业的经营管理决策;数据错误还不如没有数据,因为没有数据时,我们会基于经验和常识做出不见得是错误的决策,[详细]
-
如何采用大数据技术帮助制定数字化策略?
所属栏目:[大数据] 日期:2022-06-09 热度:126
数字化采用被定义为通过优化遗留系统和利用新技术来重塑企业。近年来,大数据一直是数字化采用的中心。这就是全球各地方的公司去年在大数据技术上花费1620亿美元以上的原因。 整个过程远不止这些,但采用新技术并将其集成到业务工作流程中是关键。为了简化[详细]
-
数据中台虚火?数据管控体系应该这么搭
所属栏目:[大数据] 日期:2022-06-09 热度:131
大数据、数据治理、数据湖以及被热议的数据中台概念,无不让企业信息化部门疲于跟进,而不是根据企业的实际情况决定建设节奏。企业A的IT部门,就曾受到业务部门要求建设数据中台的压力,但迟迟难以下决心启动数据中台项目。 从A企业的视角来看,目前,行业[详细]
-
大数据和道路安全如何携手共进?
所属栏目:[大数据] 日期:2022-06-09 热度:87
大数据现在被广泛用于预测交通和避免事故 道路交通事故仍然是一个主要问题,因为全球每年有超过 125 万人丧生。根据世界卫生组织的一份报告,它仍然是 15 至 29 岁人群的主要死因。 世卫组织已承诺采取一项强有力的举措,到 2022 年减少道路交通事故造成的[详细]
-
数据科学中数据收集的终极指南
所属栏目:[大数据] 日期:2022-06-09 热度:72
在当今世界,数据对任何一家企业的成功都起着关键作用。企业的目标受众、竞争对手产生的数据、工作领域的信息以及企业自己收集的数据可能会帮助找到更多客户、分析业务决策、重新优化业务模型或进入到其他市[详细]
-
微型机器学习有望让深度学习嵌入微处理器
所属栏目:[大数据] 日期:2022-06-09 热度:132
深度学习模型最初的成功归功于拥有大量内存和GPU集群的大型服务器。深度学习的前景催生了一个为深度神经网络提供云计算服务的行业。因此,在几乎无限的云资源上运行的大型神经网络变得非常流行,这对于具有充足预算的科技公司尤其如此。 但与此同时,近年[详细]
-
人工智能平台计划中的质量工程设计
所属栏目:[大数据] 日期:2022-06-09 热度:183
我们正处在人工智能的黄金时代。人工智能方案的采用使得企业更具创造性、竞争力和快速响应能力。软件即服务(software-as-a-service,SaaS)模式,加上云技术的进步,使软件生产和消费过程越来越成熟。 普遍存在的一个事实是,大多数组织更喜欢购买现成的[详细]
