Category: DevOps Solution
[转]大型互联网公司如何防止黑客入侵–美团
如何知道自己所在的企业是否被入侵了?是没人来“黑”,还是因自身感知能力不足,暂时还无法发现? 其实,入侵检测是每一个大型互联网企业都要面对的严峻挑战。价值越高的公司,面临入侵的威胁也越大,即便是 Yahoo 这样的互联网鼻祖,在落幕(被收购)时仍遭遇全量数据失窃的事情。 安全无小事,一旦互联网公司被成功“入侵”,其后果将不堪想象。
[转]如何在AIOps中最大限度地发挥日志系统的作用
运维数据包含海量的日志信息,随着大数据分析水平的提升,需要更加精准地挖掘日志当中的信息。如何借用人工智能的方式解决自动化运维中无法解决的问题?本文将主要介绍日志在 IT 领域中发挥的价值,以及日志易在 AIOps 方面如何做出智能的日志中心。以下内容根据日志易产品总监饶琛琳在 2018 云栖大会的演讲整理而成。
[转]苏宁海量服务器自动化配置运维实践
随着业务量的上升,服务器本身的标准化扫描,内核批量升级,在备战双 11 大促时,运维会接入大量系统扩容,配置,全局变量设定等等操作也逐渐变得常态化,动辄上千台的主机运维的工作已经不是通过堡垒机系统就可以轻松完成了。
[转]每天5万条告警,腾讯如何做到“咖啡运维”?
这十多年来,腾讯运维团队里发生的点点滴滴,在我内心中,每件事情印象都很深刻。 我把一些故事梳理了一下,发现有些事情可以跟大家交流分享,所以借这个机会跟大家谈谈腾讯最近一两年做的一些 AI 落地。
[转]如何通过深度学习轻松实现自动化监控?
监控包含安全和巡逻。在多数情况下,这项工作需要长时间进行,才能发现不希望发生的事。这项工作固然很重要,但同时也是一项平淡无奇的任务。 如果说,有什么东西能够为我们“观察和等待”,那生活不就简单多了吗?嗯,你很幸运。过去几年,随着技术的进步,我们可以为上述任务编写一些脚本来实现自动化,要做到这点非常容易。但是,在深入探讨之前,让我们先扪心自问: 1. 机器是否做得跟人类一样好? 任何熟悉深度学习的人,都知道图像分类器的准确率超过了人类。
[转]做个“懒”运维:京东数据库智能运维平台建设之路
运维自动化来源于工作中的痛点,京东数据库团队面对的是商城成千上万的研发工程师,这种压力推动我们不断变革。 然而变革不是一蹴而就,也经历过从手工到脚本化、自动化、平台化、智能化的艰难转变。 所以说是需求在驱动运维体系的建设,而运维自动化的真谛在于解放运维人员,促进人率提升,减少人为故障,要学会培养自己“懒”这个好习惯。
[转]如何用故事的方式向你的老板讲清楚运维到底在干什么?
我是一名运维工作者,可是老板,决策者并非技术出身,并不理解运维,甚至曾经碰到过有人简单的理解运维为,就是看着电脑不宕机,网络不掉线。这时候运维的困难就来了,当我们需要资源做事情的时候,决策者会带着一脸的怀疑问我们为什么。 这时候我们用一些自认为时髦的技术词语告诉领导,我们要用虚拟化管理服务器,分布式解决大并发,自动化部署应用,智能化监控应用,你猜老板能否听懂?能否立马支持你的工作?事实是,当老板听不懂你在说什么的时候,是不会支持你的,或者支持力度很小。