<div dir="ltr">I started playing with this idea. <div><br></div><div>I set up a <a href="https://groups.google.com/forum/#!forum/jenkinsci-spambot">mailing list</a>, feed wiki notifications in here, and get a bot running. Right now, the bot tries to determine whether the new page addition in Japanese, English, or Indonesian, and just reply that info back to the list.</div><div><br></div><div>I'm going to keep it like that for a few days to make sure it's detecting accurately, then I can implement the auto page removal.</div><div><br></div><div>I haven't yet implemented the page removal by reply. That'll come later.</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-03-02 12:59 GMT-08:00 Larry Shatzer, Jr. <span dir="ltr"><<a href="mailto:larrys@gmail.com" target="_blank">larrys@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">I like the idea of spreading the load around, and possibly automating it via email (or irc) to fight spam.<span class="HOEnZb"><font color="#888888"><div><br></div><div>-- Larry</div></font></span></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Mar 2, 2015 at 1:40 PM, Kohsuke Kawaguchi <span dir="ltr"><<a href="mailto:kk@kohsuke.org" target="_blank">kk@kohsuke.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">This is just an idea.<div><br></div><div>I was thinking about how we can cope more effectively with Wiki spam, and spread that workload.</div><div><br></div><div>What if we establish a mailing list based workflow? We'll create a mailing list that spam fighters will join, and this list receives the notifications from Confluence about new pages.</div><div><br></div><div>We'll have a bot monitor this list as well, and if it sees us replying to a notification email with some keyword, say "BURN IN HELL", it'll go delete that page. I think this simplifies the workflow for us humans quite a bit, and it'll make it easier for multiple people to collaborate on this task. The invitation only ML would serve as a kind of authentication mechanism, to prevent the bot from going nuts.</div><div><div><br></div><div>The bot could evolve to do more actions, such as removing the user from LDAP and perhaps feeding that information back to stopforumspam.</div><div><br></div><div>I've also experimented with a language detection library, and it seems to work well. So our bot could automatically delete all new pages if it's judged Indonesian beyond 99%+ confidence level, and it could auto-reply to that list saying it deleted the page.</div><div><br></div><div>The accumulated archive will serve as a nice record of action to analyze later.</div><div><br></div><div>Is something like this useful?</div><span><font color="#888888"><div><br></div>-- <br><div>Kohsuke Kawaguchi</div>
</font></span></div></div>
</blockquote></div><br></div>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature">Kohsuke Kawaguchi</div>
</div>