このように膨大なデータは集めるだけでも大変ですが、量だけでなく質が問題になることがあります。それは、目的となる事象の発生頻度が低く、まとまったデータが得られない場合です。
例えば、月間8000件の問い合わせのうち、月に数回だけ発生する難しい処理業務があるとします。多くの問い合わせにはマニュアルが用意され、頻繁に発生する業務なので多くのオペレータが覚えて対応できています。一方で、月に数回しか発生しない業務ではオペレータが経験を積む機会もなく、わざわざ覚えていることも少ないでしょう。そこで、こうした発生頻度の低い問い合わせを人工知能にサポートさせて、顧客満足の高い適切な回答を誰もができるようにならないかと考えます。
しかし、当然ながらそうした問い合わせは1年間データを貯め続けても数十件程度しか得られません。これでは、十分な回答精度を出すように人工知能を学習させることは難しいでしょう。こうしてすぐに使えるデータがないと、「うちでは人工知能は使えないのだろう」と結論付けてしまうことがありますが、本当に人工知能が使える場面はそこにしかないのでしょうか。