T3i：用于生成和查询 Java 测试套件的工具

2020-04-26 05:31:00 慕測科技

摘要

T3i 是一款用于测试 Java 类的自动化单元测试工具。为了使用户可以在测试过程中与工具进行交互，T3i 将生成的测试用例组织为对目标类的方法的调用序列。T3i 与其他测试工具的不同之处在于它将测试套件视为第一类对象（The first class objects），并允许用户对它们执行例如合并、查询和过滤这些操作。通过这些操作，用户可以构建具有特定属性的测试套件。用户可使用查询来检查属性的正确性，比如 Hoare 三元组，LTL 公式和代数方程。用户可以定制 T3i 提供的各种操作，因而可以通过生成的脚本进行更多的探索性测试。用户可以使用 Java 语法来控制 T3i。此外，T3i 也支持其他轻量级语法，如 Groovy。

1 引言

T3i 是一款用于自动测试 Java 类的工具。给定一个待测类 C，T3i 将生成由 C 成员方法的随机调用序列组成的测试套件，这些测试套件可以触发该类内的方法交互（同类成员方法的交互在 OO 程序中很常见）。

通常，自动化测试工具在持续不断地提供覆盖范围的过程中往往会产生一些问题。最近的一次工具比赛的结果显示：即使是得分最高的工具，也只能为基准测试的所有目标类（一共为 63 个）提供 50％的分支覆盖率。比赛中使用的所有的目标类在比赛开始前都是保密的，因此，开发人员没有办法事先将参加比赛的工具调整为适应这些目标类的最佳状态，工具使用的均为通用配置。实际上，工具可以为某些目标类提供高达 100％的分支覆盖率；但是就平均值而言，在无法对工具进行调整的情况下，工具生成的测试套件最多只能提供 50%的分支覆盖率。由此作者发现：调整工具的配置通常可以大大提高测试交付的质量。因此，T3i 的核心理念是提供一款易于用户控制和调整的自动化测试工具。

T3i 与其他自动化测试工具的不同之处在于，它将测试套件视为第一类对象（The first class objects）。T3i 提供诸如合并、查询和过滤之类的操作协助用户与工具进行交互，从而操纵测试套件的生成过程。通过这些操作，用户可以获得有关生成的测试套件的相关信息，并一步步对这些测试进行组合、过滤，以使得最终生成的测试套件满足一系列预期属性。T3i 后端依靠随机算法来实现测试序列的生成。该算法的效率很高，可以在一秒内生成数千个测试序列。用户在很短的时间内尝试不同的配置，并最终生成各自己预期的各种测试套件。

除了简单的查询（例如查询测试套件执行某个方法或经历某种状态的次数）之外，用户还可以选择采用 Hoare 三元组、LTL 范式以及代数方程式的形式执行高级查询。此类查询可用于检验查询公式的有效性，或者用于从生成的套件中过滤出满足条件（如公式表达的前提条件）的方法序列。

2 架构

图 1：T3i 架构

图 1 展示了 T3i 整体架构。其中，工具 T3 在后端完成测试序列的生成工作。T3i 包含查询和操作测试套件的操作层，以及完成 T3 配置的配置层。T3i 是一种领域特定语言（Domain Specific Language），由 Groovy 编写，因此用户可以选择通过 Groovy Shell 直接使用 T3i，也可以通过编写脚本来驱动 T3i。该脚本可以是 Groovy 脚本，也可以是 Java 脚本或 Junit 测试。T3i 生成的测试套件会保存在轨迹文件（后缀为.tr）文件中，以支持后续重加载或重放测试套件。

后端工具 T3 采用的随机算法是 Randoop 的一种变体。除此之外，T3i 还引入了“目标”的概念，即：每个测试序列的生成趋势都朝向一个既定的目标。这个目标可以是一个或一对待测方法。工具生成的序列可以描述成 σ g τ 的形式，其中：g 是代表目标，前缀 σ 用于设置 g 的随机初始状态，而后缀 τ 则用于观测 g 执行过程中产生的副作用。

图二：T3i 会话示例

图 2 展示了用户通过 Groovy-shell 与 T3i 进行交互式会话的示例，解释器响应信息中次要的部分已经从示例中略去。示例中，会话在第 1 行创建了一个配置，内容包括指定被测类（CUT）等操作；第 2 行，T3i 使用指定的配置创建后端 T3 的实例；第 3 行，T3i 调用 T3 进行测试套件的生成。T3 提供了两种方法——ADT（）和 nonADT（）——用于测试套件的生成。第一个方法用于测试 CUT 中的非静态成员，第二个用于测试静态成员。一个 ADT 操作序列总是始于创建 CUT 实例，这个 CUT 实例称为被测对象（oUT, object Under Test）。之后的相关操作均在这个 oUT 上进行。

第 7 和 9 行是对生成的测试套件的两个简单查询。第一条查询语句用于查询套件中调用了方法 foo 的测试序列个数；第二个查询语句则用于记录覆盖 oUT 的不同状态的序列个数，其中程序的状态特征用谓词{ o → o.x > 0}描述。o → o.x > 0 是 groovy 中的 λ 表达式。

3 测试套件的基本操作

用户可以通过表达式 S1 + S2 将两个测试套件 S1 和 S2 进行组合，这将产生一个由 S1 和 S2 的序列组成的全新测试套件。

为了支持测试套件的查询和过滤，T3i 引入了 Queriable 类。一个 Queriable 类的实例对象 q 表示一个可查询序列的集合。我们可以通过 q.data 直接引用这个集合，也可以使用一下方法操作这个集合：(1) 使用 q.collect()会获取 q.data； (2) 使用 q.count()获取 q.data 的规模； (3) 使用 q.sat()对可查询序列集合的状态进行判断：如果 q.count() > 0，则返回 true；(4) 假设 φ 是一个序列谓词，则 q.with(φ)会在 q 的基础上生成一个新的 Querieable 实例，这个实例的可查询集合由 q.data 中满足 φ 的序列组成。也就是说，q.with(φ)表示用谓词 φ 来对 q 中的可查询集合进行过滤，从而获取到与当前需求相关的方法序列。

如果 S 是一个普通的测试套件，则 query(S)会将其转换为一个 Queriable 实例。例如，下面的第一个表达式用于检查 φ 是否满足 S 的测试需求；第二个表达式则用于将 S 中所有满足谓词 φ 的序列搜集起来，组成一个新的测试套件 S’。

用户也可以通过下列代码来验证谓词 φ 在测试套件上的可用性：

但是上述写法比较冗长、可读性较差。用户可以选择使用 data 的补集（即那些不满足查询谓词的序列）的方式更加简洁地表达上述语义。方法 validate()可用于检查某个序列集合的补集是否为空。由此，上面的查询就可以写成：

图二中展示的方法 visit()可以用于构造序列谓词。例如，visit(name)可以构造一个用于描述名为 name 的方法或者构造器的被调用状态的谓词，即当序列中包含对 name 的调用时 visit(name)的值就为 true。文章的后续部分会介绍更多用于构造谓词的函数。

我们还可以通过一些操作实现测试套件的变换。假设 f 是一个序列到序列的函数，则 q.transform(f)会产生一个新的 Queriable 实例。这个实例的 data 由 f(σ)组成，其中 σ 表示原始序列 q 的 data 中的可查询序列。同时，新产生的 Queriable 实例的 data 只包含非空的（可以成功执行的）方法序列 f(σ)。例如：下面这个表达式将套件 S 中包含的每个测试序列 σ 中出现的第一个“f(), g()”调用序列转变成“g(), f()”，并施加过滤操作以保证生成的序列全部可用。

4 高级查询

用户也可以在 T3i 中使用 Hoare 三元组规范（即规定方法的前置条件和后置前提）。下面展示了关于方法 f(x)的两个规范。第一个变量 H1 表示：如果 x 不为空，则 f 不会抛出任何异常；而 H2 则表示：如果 x 为空，则该方法会抛出一个异常。

Hoare 三元组也可以用作序列谓词。比如，当想要检查 H2 在测试套件 S 上的有效性时，我们可以简单地使用下列表达式：

一种更强大的序列谓词表达形式是线性时间逻辑（LTL, Linear Temporal Logic）范式[1]。假设 φ 是一个 LTL 范式，用户可以使用 T3i 提供的运算符构造更复杂的 LTL 公式，相关运算符如下所示：

例如，eventually(always(φ))表示这样一个序列谓词：当序列的末尾是 φ 并且一直为 φ 的情况下，该谓词的评估结果就为 true。

5 生成测试套件

当用户在使用一些开箱即用的自动化测试工具时，经常会出现自动生成的测试用例不能够达到预期的覆盖要求的现象。这种现象屡见不鲜，其根本原因在于测试问题的不确定性。借助一定的人工调整可以大大改善自动化测试生成的测试交付，这种“人工调整”的本质在于利用工作人员的洞察力以指导工具更好地完成测试生成。设想：一个 CUT 中定义了一个方法 add(String email)，这个方法需要传入一个格式正确的、用于表示电子邮件的字符串。对于仅仅依赖随机策略进行测试生成的工具来说，这是一件非常困难的事情。T3i 则允许用户将一些预定义的值生成器交付给后端序列生成器（T3），以协助 T3 完成一些特定的生成任务。每当测试序列中的某一步有特殊需求（如需要一个关于特定方法 m(x)的调用）时，后端序列生成器通常会利用 T3 内置的值生成器来生成该特殊需求。用户可以通过一组简单表达式轻松地定制一个值生成器，如下所示：

上述表达式的语法格式与 QuickCheck 比较相似。但是，由于测试序列是随机生成的，单纯依赖随机策略的测试生成工具时不可能将值生成器与目标待测类中的特定方法对应联系起来的，这也是 T3i 与其他随机测试生成工具最显著的差异。QuickCheck 在测试生成过程中不接受任何其他输入，而 T3i 会在生成特殊值前先接收一个请求。随后，T3i 检查该请求以确保自己生成的值与用户需求相匹配。由于用户信息可以这种交互请求中进行编码大量的信息（如待生成的参数的名称），T3i 的测试生成功能理论上更强大。

由此，用户可以使用以下方式创建使用上述 G 的 T3 实例：

然后，如图 2 中的示例所示，我们可以通过调用 t3’.ADT()来生成套件。

当后端生成器需要一个 email 字符串作为参数时，G 将随机地从上面指定的电子邮件中选出一个，并交付后端生成器；同时，G 中的第二条指明了名为 region 的参数可选值列表。当生成过程中需要实例化一个 region 参数时，该参数的值就从这个列表中选取。这种选择由采用了同一分布（Uniform Distribution）的函数表达式 OneOf(…)来完成。这个表达式会构造一个 Supplier类（Java 8 提供的一个函数式接口）的实例来完成相应的生成任务。我们可以通过以下方式自定义一个 OneOf 方法的变体，如定义一种使用高斯分布的 OneOf 方法，如下所示：

致谢

本文由南京大学软件学院 2020 级硕士生钱瑞祥翻译转述。

感谢国家重点研发计划（2018YFB1003900）和国家自然科学基金（61832009，61932012）支持！

分享到:

閱讀更多 慕測科技 的文章

關鍵字: 算法套件 Groovy

ArrayList哪种循环效率更好你真的清楚吗

JAVA List 集合深复制与潜复制

Java 源码分析-Byte类分析

java 动态调用类的方法

Java 实现线程的方式有几种方式？带有返回值的线程怎么实现？

Java—发送GET、POST请求工具

JAVA 转换树结构数据

java static关键字深入理解

Java HashMap源码学习

Java 循环队列原理与用法详解

Java-字符串

Java 程序中不使用第三个变量交换两个字符串

Java 随机生成中文名字

Java 内部类详解

03.08 Java 遍历List 集合的四种方法

Java HashMap遍历的四种方式

03.08 Java HashMap遍历的四种方式

Java 如何优雅的统计代码块耗时

Java：Serializable反序列化过程

03.02 Java HashMap 常用方法详解

Java 动态代理的简单使用和理解

一遍记住 Java 常用的八种排序算法与代码实现

01.30 Java Serializable：明明就一个空的接口嘛

java 线程池的原理及使用

多个角度全方位带你看透 Java 线程池（附学习参考思路）

「Java基础」Java 反射的几种方式

09.27 java 获取当前时间的三种方法

JAVA:什么情况下需要判空对象？

java 远程接口调用RIC 矩阵计算实现

Java 集合系列： Map架构，看完才知道逻辑思维的重要性

java 一步一步教你手写ReentrantLock(二）

Java 基础之详解 Java IO

Java 字段反射

Java NIO：NIO概述

Java 并发小结

Java NIO Buffer 分散和归集

Java NIO Buffer 实践与概念

java transient 关键字

java File类

Java NIO Demo

Java Web之HttpClient请求连接池连接池

08.16 Java 并发编程必看，为你解读 Java 读写锁实现原理

Java 内功修炼第一讲之谈谈对 Java 平台的理解

Java 学习——Java 多线程三大核心点

05.31 Java高级编程——Java IO的flush

02.03 java getDeclaredXXX和getXXX方法，你是如何用，如何选择的？

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"