知识大全 专家讲解优化Derby数据库程序性能

Posted 索引

篇首语:重要的不是发生了什么事情,而是要做哪些事来改善它。本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识大全 专家讲解优化Derby数据库程序性能相关的知识,希望对你有一定的参考价值。

专家讲解优化Derby数据库程序性能  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!

  Derby这个完全Java开发的开源的数据库也不例外 因此你必须保证它不会成为你程序的一个瓶颈 尽管人们可以在Derby的手册中找到关于这个话题全面的资料 我还是想更详尽的关注一下这些问题 基于我的经验提供一些具体的例子 本文将着重于那些由在大的数据表中选择查询数据而产生的程序性能问题

  首先 有很多关于调整Derby属性(诸如页面大小和缓存大小等)的技巧 修改这些参数可以在一定程度上调整数据库的性能 但是在通常情况下 更主要的问题来自与你的程序和数据库的设计 因此 我们必须首先关注这些问题 最后再来考虑Derby的属性

  在接下来的段落里 我将介绍一些能够优化程序中有问题部分的技术 但是 和其他性能优化操作一样 我们需要在优化前先测量并确认问题所在

  一个简单的例子

  让我们从一个简单的例子开始 假设我们Web程序中拥有一个 search/list 的页面 要处理一个有接近 行的表 并且那个表不是很小的(至少有 栏) 用简单的JDBC来写一个例子 这样我们可以专注在数据库和JDBC问题上来 这篇文章中介绍的所有准则对所有的面向对象的映射工具都适用

  为了使得用户能够列出一个大的表 通常使用下面简单的查询语句 select * from tbl

  对应的JDBC语句如下 Class forName( apache derby jdbc ClientDriver ) newInstance();Connection connection = DriverManager getConnection (        jdbc:derby://localhost: /testDb; );Statement stmt = connection createStatement();ResultSet rs = stmt executeQuery( select * from tbl );ArrayList allResults = new ArrayList();while (rs next())         // Object Relation mapping code to populate your        // object from result set row        DomainObject domainObject = populate(rs);        allResults add(modelObject);System out println( Results Size: + allResults size());

  在这儿 我们碰到了第一个问题 执行这样的代码 并产生 (或更多)个domain对象将肯定会导致java用完堆栈空间 产生一个 java lang OutOfMemoryError 的错误 对于初学者来说 我们首先必须找到一个方法来使得这个程序工作

  分页Result Sets

  随着程序中数据量的增多 你首先想到的应该做的事就是为特定的记录(通常是视图)提供分页支持 正如你在这个介绍性的例子中看到的 简单地去获取庞大的result sets很容易导致 out of memory的错误

  许多数据库服务器支持特定的SQL结构 它们可以用于获得一个查询结果的特定的子集 例如 在MySQL中 提供了LIMIT和OFFSET关键字 它们可以用于select查询 因此 如果你执行类似下面的查询select * from tbl LIMIT OFFSET

  你的结果集将包含从第 个结果开始的 行 即使原先的查询返回了 行 许多其他的数据库提供商通过不同的结构提供了相似的功能 不幸的是 Derby并没有提供这样的功能 所以你必须继续使用原先的 select * from tbl 查询语句 然后在应用程序中实现一个分页的机制 让我们来看下面的例子 Class forName( apache derby jdbc ClientDriver ) newInstance();Connection connection = DriverManager getConnection(            jdbc:derby://localhost: /testDb; );Statement stmt = connection createStatement();ResultSet rs = stmt executeQuery( SELECT * FROM tbl );ArrayList allResults = new ArrayList();int i = ;while (rs next())         if (i > && i <= )                 // O R mapping code populate your row from result set                DomainObject domainObject = populate(rs);                allResults add(modelObject);                i++;System out println( Results Size: + allResults size());

  通过这些额外的语句 我们提供了 分页 的功能 尽管所有的结果都从数据库服务器中取出了 但是只有那些我们感兴趣的行才真正的映射到了Java的对象中 现在我们避免了先前碰到的 OutOfMemoryError 的问题了 这样保证了我们的程序可以真正的工作在大的数据表上

  然而 通过这个解决方案 数据库仍然会扫描整个表 然后返回所有的行 这还是一个非常消耗时间的任务 对于我的事例数据库来说 这个操作的执行要花费 秒钟 这在程序中显然是不可接受的

  因此 我们必须给出一个解决方案 我们并不需要返回所有的数据库行 而只需要那些我们感兴趣的(或者至少是所有行的最小可能子集) 我们这儿使用的技巧就是显式的告诉JDBC驱动我们需要多少行 我们可以使用java sql Statement接口提供的setMaxRows()函数来完成这个任务 看以下下面的例子 Class forName( apache derby jdbc ClientDriver ) newInstance();Connection connection = DriverManager getConnection(            jdbc:derby://localhost: /testDb; );Statement stmt = connection createStatement();stmt setMaxRows( );ResultSet rs = stmt executeQuery( SELECT * FROM tbl );ArrayList allResults = new ArrayList();int i = ;while (rs next())         if (i > && i <= )                 // O R mapping code populate your row from result set                DomainObject domainObject = populate(rs);                allResults add(modelObject);        System out println( Results Size: + allResults size());

  值得注意的是 我们把最大行的值设置为了我们需要的最后一行(增加了 ) 因此 通过这样的解决方案 我们不是仅仅取得了我们想要的 行 而是先获取了 行 然后从中筛选出我们感兴趣的 行 不幸的是 我们没有办法告诉JDBC驱动从一个具体的行开始 因此我们必须说明要显示的记录的最大行数 这就意味着返回最初的一些记录的操作的性能是很好的 但是随着用户浏览的结果的增多 性能也会下降 好消息就是在大多数的情形下 用户不会浏览的太多的记录 他们会在前几条记录重获得他们寻找的行 或者改变查询策略 在我本人的环境中 上述的例子的执行时间从 秒降到了 秒

  这是一个描述如何浏览整个表的简单的例子 但是当查询语句中增加了特定的where条件和排序信息时 事情又开始变化了 在接下来的部分里 我将解释为什么这种情况会发生 以后我们如何保证在那些例子中获得可接受的性能

  确保使用索引(避免全表扫描)

  索引在数据库设计中是一个非常重要的概念 因为本文所涉及的范围有限 我并不会详细的介绍索引理论 简单来说 索引是特定的数据库结构 能够允许对表中的行进行快速访问 索引通常是在一栏或多栏上创建的 因为他们比整个表小了很多 他们的主要用处就是快速搜索一栏(多栏)中的值

  Derby自动的为主键和外键的栏以及具有唯一性限制的栏创建索引 对于其他任何栏 我们必须显式的创建索引 在接下来的段落中 我们将研究一些例子来介绍索引在什么时候有用以及为什么有用

  但是首先 我们必须做一些准备 在我们开始优化之前 我们需要能够了解我们执行查询操作的时候数据库中发生了什么 Derby提供了derby language logQueryPlan这个参数 如果设置了这个参数 Derby将会把所有执行的查询的查询计划(query plan)记录在derby log这个文件中(这个文件在derby system home文件夹中) 我们可以在启动服务器之前通过合适的derby properties文件或者执行如下的java语句来设置该参数 System setProperty( derby language logQueryPlan true );

  通过检查查询计划 我们可以观察Derby在查询中是使用了索引还是进行了全表查询 全表查询是一个很耗时间的操作

  既然我们已经设置好了环境 我们可以开始我们的例子了 假设我们先前使用的表 tb 中有一个没有索引的栏叫做owner 因为对查询结果的排序通常是查询性能低下的主要原因 我将介绍所有与排序有关的优化 现在 如果我们希望修改先前的例子来根据这一栏的值来排序我们的结果 我们需要把我们的查询语句改成如下的样子 SELECT * FROM tbl ORDER BY owner

  如果我们用这个查询语句代替先前的语句 执行的时间将是先前的好多倍 尽管我们分页(paginated)了所有的结果 并小心的设置了要获取的行数 总的执行时间将会是 秒

  如果我们查看derby log文件中查询执行计划 我们可以轻易的发现问题 Table Scan ResultSet for TBL at read mitted isolationlevel using instantaneous share row locking chosenby the optimizer

  这意味着Derby为了将记录排序 是在整个表中执行了查找这个操作 那我们可以做些什么来改善这个情况呢?答案很简单 在这一栏上创建一个索引 我们可以通过如下的SQL语句来做这件事 CREATE INDEX tbl_owner ON tbl(owner)

  如果我们重复我们先前的例子 我们将得到一个和我们没有做排序前的那个例子相似的结果(在我的机器上是不到 秒)

  同样 如果你现在查询derby log 你将看到下面的信息(而不是和上面的一样的) Index Scan ResultSet for TBL using index TBL_OWNERat read mitted isolation level using share row lockingchosen by the optimizer

  这就意味着我们可以确保Derby使用了刚创建的索引来获取合适的行

  使用合适的索引顺序

  我们已经看到了索引是如何帮助我们改善了排序某一栏数据时的性能 但是如果我们尝试去反转排序的顺序的时候会发生什么呢?假设我们希望根据owner栏降序分类我们的数据 在这种情况下 我们原先的查询就会变成如下的语句 SELECT * FROM tbl ORDER BY owner DESC

  注意 我们增加了DESC这个关键字 该关键字将按降序来排序我们的结果 如果我们执行这个新修改过的查询语句 将会发现整个执行的时间又增加到先前的 - 秒 并且 在日志文件中 你将会发现又是执行了全表扫描

  解决的方法就是为这一栏创建一个降序的索引 对于我们的owner栏 我们执行如下的SQL语句 CREATE INDEX tbl_owner_desc ON tbl(owner desc)

  现在我们对这一栏有两个索引了(两个顺序) 因此查询性能又恢复到了可接受的范围了 注意查询日志中这一行 Index Scan ResultSet for TBL using index TBL_OWNER_DESCat read mitted isolation level using share row lockingchosen by the optimizer

  这使我们确信我们使用了新建的索引 因此 如果你经常要对结果进行降序排序的话 你应该考虑创建一个合适的索引来获取更高的性能

  重建索引

  随着时间的流逝 索引记录将产生碎片 这将导致严重的性能下降 例如 如果我们有一个很久以前创建的索引 例如tb 表的time_create栏

  如果我们执行如下的查询SELECT * FROM tbl ORDER BY time_create

  我们得到很差的性能 很大可能是因为我们根本没有一个索引 不过 如果我们看了以下日志 就可以发现问题所在 你会发现我们使用了索引 但是将看到和下面相似的信息 Number of pages visited=

  这意味着数据库在索引查询过程中执行了大量的IO操作 这就是这个查询过程的瓶颈所在

  这种情况的解决方法就是重建索引(drop然后重建它) 这将使得索引进行整理碎片 从而节省我们大量的IO操作时间 我们可以通过下面的SQL语句来重建索引 DROP INDEX tbl_time_createCREATE INDEX tbl_time_create ON tbl(time_create)

  你将发现执行时间又降到一个可接受的值( 秒以内) 同样 你在日志文件中将发现如下的行 Number of pages visited=

  正如你看到的 执行时间明显的下降了是因为数据库执行了很少的IO操作

  因此 通常的规则就是让你的程序定期重建索引 最好是在程序计划任务一个后台的工作来不时的完成这个工作

  多栏索引

  到目前为止 我们专注于简单的单栏的索引和简单的查询 创建owner和time_create的单栏索引可以帮助我们进行过滤和排序 即使时下面的查询语句也具有可接受的性能

  SELECT * FROM tbl WHERE owner = dejan AND time_create > : : ORDER BY time_create

  但是如果你尝试执行如下的查询 SELECT * FROM tbl WHERE owner = dejan ORDER BY time_create

  那又会是一个漫长的执行过程 这是因为数据库为了排序数据需要执行额外的排序步骤

  解决这种类型的查询的办法就是创建一个包含owner和time_create的索引 我们可以通过执行下面的查询来创建索引 CREATE INDEX tbl_owner_time_create ON tbl(owner time_create)

  通过使用这个索引 查询的性能将会得到很大的改善 现在 注意下面的分析日志 Index Scan ResultSet for TBL using index TBL_OWNER_TIME_CREATEat read mitted isolation level using share row lockingchosen by the optimizer

  我们通过使用一个便利的索引来使得数据库可以快速的找到已经排好序的数据

  这个例子中值得注意的是 在 create index 语句中的栏的顺序是非常重要的 多栏索引只有通过在创建索引时定义的第一个栏时才是可优化的 因此 如果我们创建了如下的索引 CREATE INDEX tbl_time_create_owner ON tbl(time_create owner)

  而不是先前我们使用的索引 我们将不会发现什么性能的优化 那是因为 derby的优化器不认为这个索引是最好的解决方案 从而忽略了它

  索引的缺点

  索引可以帮助我们在选择数据的时候改善性能 当然 这也减慢了数据库插入删除以及一些更新操作 因为我们不仅仅有表结构 还有很多的索引结构 所以当数据发生变化时 维护所有的结构是很耗时间的

  例如 当我们在表中插入一行数据的时候 数据库必须更新和这个表的栏有关的所有的索引 这就意味着它必须将一个已索引的栏的数据插入到合适的索引中 这将很花时间 同样的事也会在你删除一个特定的行的时候发生 因为索引必须保证顺序 对于更新操作来说 只有当你更新了已索引的栏的时候受到影响 因为数据库必须重新定位这些索性来保持索引的顺序

  因此 优化数据库和程序设计的关键在于你的需要 不要索引每一个栏 你不一定会要用到这些索引 而且你可能需要优化你的数据库来进行快速的插入 在早期就开始测试数据库的性能并发现瓶颈 只有那时你才该去应用本文中提到的技术

  结论

cha138/Article/program/Java/hx/201311/25975

相关参考

知识大全 Java程序性能优化-数据库调优

Java程序性能优化-数据库调优  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!   数据

知识大全 实例讲解MYSQL数据库的查询优化技术

实例讲解MYSQL数据库的查询优化技术  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  数据库系统

知识大全 Java程序性能优化-看懂程序的性能

Java程序性能优化-看懂程序的性能  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!   

知识大全 asp.net编程程序优化要注意的问题

  一SqlDataRead和Dataset的选择  Sqldataread优点读取数据非常快如果对返回的数据不需做大量处理的情况下建议使用SqlDataReader其性能要比datset好很多缺点直

知识大全 Java程序性能优化-性能概述

Java程序性能优化-性能概述  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  第章 J

知识大全 Java程序性能优化-优化的一般步骤

Java程序性能优化-优化的一般步骤  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!   

知识大全 Java程序性能优化-系统优化注意事项

Java程序性能优化-系统优化注意事项  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!   

知识大全 Java程序性能优化-性能的参考指标

Java程序性能优化-性能的参考指标  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!   

知识大全 体验纯Java数据库——Derby

体验纯Java数据库——Derby  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  ApacheD

知识大全 Java程序性能优化-木桶原理与性能瓶颈

Java程序性能优化-木桶原理与性能瓶颈  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  &nbs