我想从事一个假新闻检测项目,特别是针对不同语言和不同格式的印度新闻。
- 假新闻作为没有文字或文字很少的图像
- 博客网站上的假新闻
- 假新闻作为推文
- 印地语的假新闻
- watsapp 组中的假新闻并共享。
在方法上需要你的帮助。我能想到的一种方法是使用 OCR,我们可以阅读帖子的内容,然后在 google 中搜索这些内容。如果新闻没有出现在任何著名的印刷媒体中,那么我们可以将其标记为假新闻。然而,在这方面可能存在许多挑战。如果印刷媒体本身提供任何由某人分享的假新闻怎么办。
如何处理图像中没有文字但显示为图像的信息是假的场景。
如何处理用印地语写的帖子。?
即使我们检测到假新闻,有没有办法让这个人对分享它负责。? 我知道解决这个问题并不难。但是目前有没有任何公司在这方面做过任何工作。? 我进入这个领域的任何起点?