姿势识别 怎么差异这么大

使用openpose的caffe模型,识别结果如下,效果不好。

而用keras的h5模型,却识别的效果好很多。为什么,哪位大侠能知道原因??