如何利用机器学习检测市场操纵?

今天分享一篇挺有意思的论文”Market Manipulation: An Adversarial Learning Framework for Detection and Evasion“,这个课题比较少见,利用对抗神经网络来检测市场操纵行为。

想要检测市场操纵行为,首先要定义什么是市场操纵。如上图所示就是一种很常见的市场操纵行为。首先做市商抛出大量略高于成交价格的卖单(抵想要成交需要卖单价格等于买单价格,所以这些卖单以及后面的买单只会下单而不会成交)打压价格,让价格快速下跌,在价格低于一个标准之后大量卖进,之后利用略低于成交价的买单推动价格上涨,到达另一个标准后再大量卖出,从而达到盈利的目的。当然这是一个非常理想化的过程。

上述这种行为可以看作是一种目标攻击(targeted attack),目的是扰乱市场的供给与需求信号,从而让市场上的交易者做出错(被)误(割)判(韭)断(菜)。既然本质上是一种扰乱市场的行为,那么自然会有监管,Nasdaq 最近已经开始使用基于AI的技术来监查这种操作。所有与欺诈检测相关的技术最后都会变成一种“猫鼠游戏”,而GAN非常适合建模这个过程。

不过这篇论文我个人觉得比较遗憾的是它没有使用真实的数据,而是采用了仿真的方式来生成模拟数据。模拟数据分为三种:Manipulation Strategy (SP), Market-making Strategy (MM), Exploitation Strategy (EXP)。

  • SP就是上面介绍的策略,分为三个阶段:第一阶段买入所有低于目标价\bar{r}的卖单,第二阶段停止买入,之后利用大量低于成交价的买单推高价格,最后一个阶段将所有抵押物以高于\bar{r}的价格卖出。

  • MM策略则是一种模拟的正常交易行为,在预测的目标价格附近存在大量的阶梯定价的买单和卖单,这些订单由几个参数控制着随机生成。

  • EXP策略则是对照组,它执行SP策略在第一阶段和最后一个阶段的买卖行为,目的是消除操纵订单的影响。

文章采用的模型是常规的GAN结构,包括一个生成器和判别器,生成器的目标是生成一段可以骗过判别器的SP交易序列,判别器的目的是将SP序列与MM序列区分开。文章中使用hidden size为64的双向GRU来作为生成器和判别器。实验发现生成的SP序列和MM序列会逐渐接近,最终失去操纵的效果。

总的来说,这篇文章的模型和实验部分乏善可陈,但是在研究的问题比较有价值,而且可以做不少扩展,比如使用真实的交易数据,如何让做市获得最大的利润,如何更好的检测做市行为等,都是不错的方向,对于市场监管也有一定的价值。

0 0 投票数
Article Rating
订阅评论
提醒
0 评论
内联反馈
查看所有评论