三种东西永远不要放到数据库里 - 开源中国社区
三种东西永远不要放到数据库里
oschina 2012年05月15日

三种东西永远不要放到数据库里

oschina oschina 发布于2012年05月15日 收藏 217 评论 34

有免费的MySQL,为什么还要买? >>>  

我已经在很多演讲里说过,改进你的系统的最好的方法是先避免做“蠢事”。我并不是说你或你开发的东西“蠢”,只是有些决定很容易被人们忽略掉其暗含 的牵连,认识不到这样做对系统维护尤其是系统升级带来多大的麻烦。作为一个顾问,像这样的事情我到处都能见到,我还从来没有见过做出这样的决定的人有过好 的结果的。

图片,文件,二进制数据

既然数据库支持BLOB类型的数据,把文件塞进BLOB字段里一定没有错了!?错,不是这样的!别的先不提,在很多数据库语言里,处理大字段都不是很容易。

把文件存放在数据库里有很多问题:

  • 对数据库的读/写的速度永远都赶不上文件系统处理的速度
  • 数据库备份变的巨大,越来越耗时间
  • 对文件的访问需要穿越你的应用层和数据库层

这后两个是真正的杀手。把图片缩略图存到数据库里?很好,那你就不能使用nginx或其它类型的轻量级服务器来处理它们了。

给自己行个方便吧,在数据库里只简单的存放一个磁盘上你的文件的相对路径,或者使用S3或CDN之类的服务。

短生命期数据

使用情况统计数据,测量数据,GPS定位数据,session数据,任何只是短时间内对你有用,或经常变化的数据。如果你发现自己正在使用定时任务从某个表里删除有效期只有一小时,一天或数周的数据,那说明你没有找对正确的做事情的方法。使用redisstatsd/graphiteRiak,它们都是干这种事情更合适的工具。这建议也适用于对于收集那些短生命期的数据。

当然,用挖土机在后花园里种土豆也是可行的,但相比起从储物间里拿出一把铲子,你预约一台挖土机、等它赶到你的园子里挖坑,这显然更慢。你要选择合适的工具来处理手头上的事。

日志文件

把日志数据存放到数据库里,表面上看起来似乎不错,而且“将来也许我需要对这些数据进行复杂的查询”,这样的话很得人心。这样做并不是一个特别差的做法,但如果你把日志数据和你的产品数据存放到一个数据库里就非常不好了。

也许你的日志记录做的很保守,每次web请求只产生一条日志。对于整个网站的每个事件来说,这仍然会产生大量的数据库插入操作,争夺你用户需要的数据库资源。如果你的日志级别设置为verbose或debug,那等着看你的数据库着火吧。

你应该使用一些比如Splunk Loggly或纯文本文件来存放你的日志数据。这样去查看它们也许会不方便,但这样的时候不多,甚至有时候你需要写出一些代码来分析出你想要的答案,但总的来说是值得的。

可是稍等一下,你是那片不一样的雪花,你遇到的问题会如此的不同,所以,如果你把上面提到的三种东西中的某一种放到了数据库里也不会有问题。不,你错了,不,你不特殊。相信我。

[本文英文原文链接:Three things you should never put in your database ]

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:三种东西永远不要放到数据库里
分享
评论(34)
最新评论
0
受教了!
0
我们的登录日志放在数据库里了,但我们的情况比较特殊,不是普通的web登录,而是安卓客户端,登录后信息存放到安卓客户端本地,因此登录一次可以维持很久很久不需要再登录。
0
如今因为我们产品的业务日志存在数据库里,现在正在面临一场灾难。
0
学习了
0
这些都是设计的经验谈吧,有应用的场合,特别是web适用。
0
首先标题加个:针对WEB应用 更好了

其次有些东西也不是绝对的,比如短生命期数据中的GPS数据

如果你某个应用希望有轨迹功能,那就DB存储吧

个人很不喜欢永远和永远不这2个词的

虽然当年为了把妹把这2个词反复说
0
我亲身经历的,图片存数据库,239个G ,我接手后直接全部移除到本地。。。汗呀 直接把那个设计骂死了
0
很有用
0
对于文件不要存放到数据库,我觉得不是绝对的。对于网站如论坛新闻等我觉得是应该的。但对于一个只有少数文件类型的系统,比如人事系统,可能只是存些个人照片,证书的照片,我还是更喜欢存放到数据库中,备份恢复都方便。
0

引用来自“阿影”的评论

logback 比 log4j快多了,而且并发能力不错。

有测试报告不?
0

引用来自“ZhengMinhui”的评论

业务相关的日志可以放在数据库也必须放在数据库。。。系统级别的就存文件最好。。。

业务相关的也可以存放到文件中吧,不一定必须放数据库的。
0
你说的东西如果按你的做法当然是绝对不能放进去的。但是并不代表放进去就是错误的,比如日志文件,如果产生一条写一条到库里,是及其不合理,起码用到调度或日志定量同时处理,才不会对系统产生影响。文件放到系统磁盘有利有弊端,被篡改的几率远远高于数据库的篡改,而且对于大字段的读写,都有底层设计完成,学校里的学生做练习还是不错。放不妨在数据库里是业务设计的需要,如何放到数据库里是技术实现策略,效率是设计人员的水平,看看自己的问题在哪个环节
0
学习了...
0
Loggly是什么?没搜到
0
blob正在用。
0
logback 比 log4j快多了,而且并发能力不错。
0
把数据转换为 二进制数据存进了数据库,感觉还凑合呀。varbinary类型
0
恩 ,的确 一个是日志,一个是图片, 日志采用log4j.properties 图片采取文件夹。
0

引用来自“腾勇”的评论

引用来自“benbenming”的评论

说的不错,常常见到将图片保存到数据库的情况,备份真的很郁闷。

oh my god 常见

一般保存个文件名不就可以了吗?
0

引用来自“FreeZ”的评论

我想说任何方法都不是绝对的

+1,哪有那么绝对的东西..
顶部