[清空]播放記錄
熱門搜索
1恒源祥:一根毛线穿起的流行与创新 营创赛重磅推出
2浅谈未婚国外生子怎么办护照,2024这些材料需准备
3剖腹产术后的24小时该如何护理?医生:做好这些,身体恢复快!
4放下锄头拿起画笔 “东方毕加索”走向世界
5迸发创新基因中国西藏网融媒体矩阵添新军
6剖腹产术后的24小时该如何护理?医生:做好这些,身体恢复快!
7科技赋能阅读 智慧点亮童心
8大饱眼福!宁德“禁毒+艺术”碰撞出怎样的火花?
2025-12-20 23:58:48更新 / 84分/ 每体:罗克愿意加盟拉齐奥,后者提出2000万欧收购其50%所有权 /内地多方面培育创科人才 /
導演:
主演:
主演:,,,,
主演:,,,,,
主演:,,,
主演:,,
记者获悉,小红经过一年奋战,书将数据小红书已把业界体量最大的业界WhatsApp%E3%80%90+86%2015855158769%E3%80%91oregon%20ducks%20football%20jersey%202024数据湖0故障迁上阿里云。据统计,最大至该项目共有1500人参与,湖迁迁移数据500PB。小红
作为中国头部互联网公司之一,书将数据小红书月活已过3亿,业界其数据湖存储了过去11年的最大至所有原始数据,包括结构化、湖迁半结构化和非结构化数据。小红近年来,书将数据随着业务的业界WhatsApp%E3%80%90+86%2015855158769%E3%80%91oregon%20ducks%20football%20jersey%202024高速增长,小红书在线处理数据的最大至需求不断增加,同时离线处理所积累的湖迁历史问题,也会在未来的切换中带来更多成本与风险。
为此,2023年11月,小红书发起迁云项目——计划一年内,把小红书的数据湖搬上阿里云。
迁移至阿里云上后,数据湖可通过多个OSS Bucket支持纳入统一资源池,实现多个Bucket共享资源池内的OSS吞吐及QPS能力。这样的流控能力在面向小红书复杂业务场景,可灵活调配资源,高效利用吞吐性能,降低不同业务租户间的互相影响。阿里云原生HDFS+DLA元数据可实现无缝对接Hadoop EMR体系,支持元数据线性扩展能力,轻松应对小红书数百PB数据下的元数据线性增长。
较于过往业界体量最大的案例,小红书的本次迁移的数据体量更大。
?
*注:任务=数据处理过程
?(圖片來自小紅書官方公眾號)
据介绍,小红书的迁云项目经历了三个阶段。第一步,项目组首先解决标准问题,然后根据标准进行治理;第二步,完成治理后,项目在2024年5月正式进入双跑阶段。把数据拷贝到阿里云上,两边同时跑数,验证正确性与及时性;第三步,2024年8月,项目结束双跑,进入割接阶段。阿里云团队全程在现场保障,顺利完成了割接。
2024年11月,小红书迁云项目正式宣告结束。在0故障的情况下,迁移数据500PB,任务11万,参与人数1500人,涉及部门40多个。项目涉及产品之多和数据体量之大均创下业界记录。
雷峰网(公众号:雷峰网)
Copyright © 2025 Powered by 呼來喝去網 sitemap
首頁
焦点
娱乐
休闲
探索
时尚
综合
热点
知识
记者获悉,小红经过一年奋战,书将数据小红书已把业界体量最大的业界WhatsApp%E3%80%90+86%2015855158769%E3%80%91oregon%20ducks%20football%20jersey%202024数据湖0故障迁上阿里云。据统计,最大至该项目共有1500人参与,湖迁迁移数据500PB。小红
作为中国头部互联网公司之一,书将数据小红书月活已过3亿,业界其数据湖存储了过去11年的最大至所有原始数据,包括结构化、湖迁半结构化和非结构化数据。小红近年来,书将数据随着业务的业界WhatsApp%E3%80%90+86%2015855158769%E3%80%91oregon%20ducks%20football%20jersey%202024高速增长,小红书在线处理数据的最大至需求不断增加,同时离线处理所积累的湖迁历史问题,也会在未来的切换中带来更多成本与风险。
迁移至阿里云上后,数据湖可通过多个OSS Bucket支持纳入统一资源池,实现多个Bucket共享资源池内的OSS吞吐及QPS能力。这样的流控能力在面向小红书复杂业务场景,可灵活调配资源,高效利用吞吐性能,降低不同业务租户间的互相影响。阿里云原生HDFS+DLA元数据可实现无缝对接Hadoop EMR体系,支持元数据线性扩展能力,轻松应对小红书数百PB数据下的元数据线性增长。
较于过往业界体量最大的案例,小红书的本次迁移的数据体量更大。
*注:任务=数据处理过程
?(圖片來自小紅書官方公眾號)
据介绍,小红书的迁云项目经历了三个阶段。第一步,项目组首先解决标准问题,然后根据标准进行治理;第二步,完成治理后,项目在2024年5月正式进入双跑阶段。把数据拷贝到阿里云上,两边同时跑数,验证正确性与及时性;第三步,2024年8月,项目结束双跑,进入割接阶段。阿里云团队全程在现场保障,顺利完成了割接。
2024年11月,小红书迁云项目正式宣告结束。在0故障的情况下,迁移数据500PB,任务11万,参与人数1500人,涉及部门40多个。项目涉及产品之多和数据体量之大均创下业界记录。
雷峰网(公众号:雷峰网)