, .
ternaus Data Science Challenge,
- . Mail.Ru Group
, , , . .
. , Data Science Challenge , .
. , . , , .
, , , . , , .
. Kaggle , Slack- Open Data Science. . , , , ODS. , 30 . , .
. , , - . , - , . , .
, . Kaggle , . , - . , .
MI6, MI5 Defence Laboratory . , . , , , .
465 . 100 , 365 , , Kaggle , , . . . , Kaggle: , train predict, , . , . , - . , , , , . . . , , , . , . , - -.
, . , Kaggle. - , , , Kaggle . computer vision, , natural language processing. - , . , . .
, , data science . . , private public, , , .
- ? : , 40 . . , . , , . . , , -, , , . , , . , .
, , , ? , , , - , -, , . , .
. Kaggle data leak, , , - , train test . , . . , , , , XGBoost , - .
. , . 1200 , 100 , , . 5 , object detection. , : , . . . , , , , , , - .
, . . . , , , , . . . , 5 . . object detection.
, , . , , class inbalance, , , .
. , , - , . , , . , . , , , .
.
? , -. , , , bounding boxes, , , , .
, Google, , , , , , bounding boxes, . . , , , .
, bounding boxes, . , object detection bounding box, , . Loss function . , . . , , Kaggle, .
200 200. , 600 , 600.
. , , . , , .
Jaccard. ? , , . . , , , true positive. false positive. false negative.
. , , . Jaccard, true positive union.
. deep learning . , , , - . Kaggle, , . ImageNet 2017 , .
- , ? , , . . , , , .
. ? . Kaggle , . , , . 3000 , , , . .
, , - . . , , .
. . , 50 , . -, , . . , Kaggle, Slack , . .
. , - . , , , , , , , , , Kaggle. . - , . .? , . . xgboost . Kaggle , - . , , , , , . Kaggle .
. ? , . . , , - . , . , . , - -, , . .
Image detection. ImageNet, . image detection. , , . detection , . J : - ? . . . .
, 6 public, 26 private, - shuffle leaderboard. . train, test, , . data leak. Quora, : , ? , . , .
, - , . , , . , .
, . ? . , , crowd counting . : , - , , , . . , , , , . .
, . , - , , . . - - . , . .
bounding boxes. sloth train set. , , . , bounding box . Kaggle , , . .
Google , . 11 . , , Google , , , , GPU, , . , object detection, .
, Faster R-CNN, SSD. SSD, Faster RCNN.
. Faster R-CNN , . , , . , . , . SSD : , . , . Faster R-CNN.
, . , bounding boxes, , . . , Faster.
- . . . . loss-, , . , , .
, . : TensorFlow, Theano, Keras, MXNet, Cafe, - . , , , .
Keras Theana TensorFlow. Keras API, , , GitHub , - .
, , , , GPU. , , , , . Keras . , -10 . , . overhead , TensorFlow , Keras overhead. , , .
Slack MXNet , , , . - . Slack , , . Faster R-CNN , GPU, . Keras MXNet.
. . - . . , , , , , . . , . , , MXNet. . -5, MXNet .
. ? MXNet, , , Faster R-CNN. , ( . .), . , -, 2000 2000 . , , .
1000 1000. D4 group augmentation. ? , . , - , , 90 , . D4, 8 . , , 90, , .
? 2000 2000, 1000 1000, , . .
, - 90 , 100, . GPU 8. , Faster .
. ? 2000 2000 1000 1000 . , , , , , - , . , , -. . non-maximum suppression. , 2000 2000 , . , . non-maximum suppression. bounding box , , confidence , , .
, , , , . .
, Slack, .
. , , , , , . GPU Titan Pascal X - 20 , 20 . .
, . , . , . bounding boxes . , , . , , , - . - , - . , , Kaggle, , . , , . , , . , - .
close packed objects, , . - , , , .
, , . . , . - . , , . 0 100. : 100% , 99%. . . , .
- , . , 70100 . , - . . , . , . . , - . . -, . , .
- , . , , . , , , , .
, . , . - 0,85 100, 1200 ,
, 1200. 20, , , 50.
, , , , , , , . - . , , . .
. - , , , . - ? , .
, . , , , . . , , , 0,85 0,87, - 0,950,97. . , . , , . .
, Facebook, , . , - , -. , .
10 , , , jane.ostin, . . , - Kaggle. Kaggle .
, public private. Kaggle: - private, , . , , . , , . .
, Kaggle, , private public, 33% 66%. , public public, private private. , , public private . , Kaggle , private. . , gbarbadillo, 84 . Kaggle , , public, private. , , , private . , 0,87 , - 180 , 180 . , , 'o . , , .
2000 2000. . , , , . . , . 99, 100 , . - - , .
. ? bounding boxes, . , Slack , . , , , .
Faster R-CNN, base VGG-16. ResNet, . VGG.
D4, , train and test, .
. CPU . 32 , , . 16 . Titan . e-mail : , , , . - , . , . : ? , random seed, . , , . MXNet, . , , - , , . , , , .
GPU Slack : , deep learning , , , ? , , ? : , GTX 1080 , . - - , . GPU . , Keras . . , , -, . GPU, . , , .
. , , . , ! , . . - , object detection , , . , . -, , , . .
https://habrahabr.ru/post/335002/