<html><head></head><body><div class="ydp9d95fc71yahoo-style-wrap" style="font-family:Helvetica Neue, Helvetica, Arial, sans-serif;font-size:13px;"><div></div>
        <div dir="ltr" data-setdir="false">Interesting article.</div><div dir="ltr" data-setdir="false"><br></div><div dir="ltr" data-setdir="false"><div><div>Key phrase: "book-pirating websites". That is knowingly using pirated content. Case closed, legally.</div></div></div></div><blockquote style="margin: 0 0 0 40px; border: none; padding: 0px;"><div class="ydp9d95fc71yahoo-style-wrap" style="font-family:Helvetica Neue, Helvetica, Arial, sans-serif;font-size:13px;"><div dir="ltr" data-setdir="false"><div><div><br></div><div>“Would people be less angry with me if I bought a copy of each of these books?” Smith wonders out loud as we talk over Zoom. “Yes,” I say.  </div></div></div></div></blockquote><div class="ydp9d95fc71yahoo-style-wrap" style="font-family:Helvetica Neue, Helvetica, Arial, sans-serif;font-size:13px;"><div dir="ltr" data-setdir="false"><div><div><br></div><div>This guy clearly was never taught how authors make money. If you reduce the number of copies of a work sold in any way, you are on shaky ground. Use your scrapings (except for brief passages quoted for academic or critique/review purposes) for any commercial purpose, and you (probably) are over the line. But I'm guessing they don't teach copyright law in computer programming and engineering curricula. </div><div><br></div><div>I am not familiar with SciHub or LibGen or the issues raised by their activities. I suspect these sites differ from true pirate sites in that they are academic in their purpose, not commercial. My suspicions are bolstered by this quote:</div></div></div></div><blockquote style="margin: 0 0 0 40px; border: none; padding: 0px;"><div class="ydp9d95fc71yahoo-style-wrap" style="font-family:Helvetica Neue, Helvetica, Arial, sans-serif;font-size:13px;"><div dir="ltr" data-setdir="false"><div><div><br></div><div>“I’m not against all data scraping,” Devin Madson says. “I know a lot of academics in digital humanities, and they do scrape a lot of data.” </div></div></div></div></blockquote><div class="ydp9d95fc71yahoo-style-wrap" style="font-family:Helvetica Neue, Helvetica, Arial, sans-serif;font-size:13px;"><div dir="ltr" data-setdir="false"><div><div><br></div><div>While it isn't settled law, I think the "fair use" doctrine is not applicable in full to this incident. I do note with some interest that many authors are now insisting on clauses in their contracts with publishers explicitly forbidding the use of their works in training AI and LLM products. And I also note that some publishers are refusing to include this language in their contracts with authors. </div></div><br></div><div dir="ltr" data-setdir="false">-- Bob Primak </div><div dir="ltr" data-setdir="false"><br></div>
        
        </div><div id="yahoo_quoted_3056739039" class="yahoo_quoted">
            <div style="font-family:'Helvetica Neue', Helvetica, Arial, sans-serif;font-size:13px;color:#26282a;">
                
                <div>
                    On Tuesday, August 15, 2023 at 10:48:31 AM EDT, John Rudy via LCTG <lctg@lists.toku.us> wrote:
                </div>
                <div><br></div>
                <div><br></div>
                <div><div id="yiv1796794777"><style><!--

#yiv1796794777 filtered {}
#yiv1796794777 filtered {}

#yiv1796794777 p.yiv1796794777MsoNormal, #yiv1796794777 li.yiv1796794777MsoNormal, #yiv1796794777 div.yiv1796794777MsoNormal
        {margin:0in;font-size:11.0pt;font-family:"Calibri", sans-serif;}
#yiv1796794777 a:link, #yiv1796794777 span.yiv1796794777MsoHyperlink
        {color:#0563C1;text-decoration:underline;}
#yiv1796794777 span.yiv1796794777EmailStyle17
        {font-family:"Arial", sans-serif;font-variant:normal !important;color:windowtext;text-transform:none;text-decoration:none none;vertical-align:baseline;}
#yiv1796794777 .yiv1796794777MsoChpDefault
        {font-family:"Calibri", sans-serif;}
#yiv1796794777 filtered {}
#yiv1796794777 div.yiv1796794777WordSection1
        {}
--></style><div><div class="yiv1796794777WordSection1"><p class="yiv1796794777MsoNormal"><span style="font-size:12.0pt;font-family:Arial, sans-serif;">A very interesting article from WIRED on some issues around data scraping</span></p><p class="yiv1796794777MsoNormal"><span style="font-size:12.0pt;font-family:Arial, sans-serif;"><a rel="nofollow noopener noreferrer" target="_blank" href="https://www.wired.com/story/prosecraft-backlash-writers-ai/?bxid=5bf82a6624c17c5aa3198362&cndid=28192571&esrc=VERSO_NAVIGATION&mbid=mbid%3DCRMWIR012019%0A%0A&source=Email_0_EDT_WIR_NEWSLETTER_0_DAILY_ZZ&utm_brand=wired&utm_campaign=aud-dev&utm_content=WIR_Daily_081423&utm_mailing=WIR_Daily_081423&utm_medium=email&utm_source=nl&utm_term=P4">https://www.wired.com/story/prosecraft-backlash-writers-ai/?bxid=5bf82a6624c17c5aa3198362&cndid=28192571&esrc=VERSO_NAVIGATION&mbid=mbid%3DCRMWIR012019%0A%0A&source=Email_0_EDT_WIR_NEWSLETTER_0_DAILY_ZZ&utm_brand=wired&utm_campaign=aud-dev&utm_content=WIR_Daily_081423&utm_mailing=WIR_Daily_081423&utm_medium=email&utm_source=nl&utm_term=P4</a></span></p><p class="yiv1796794777MsoNormal"><span style="font-size:12.0pt;font-family:Arial, sans-serif;">  </span></p><p class="yiv1796794777MsoNormal"><span style="font-size:10.0pt;font-family:Arial, sans-serif;">John Rudy</span></p><p class="yiv1796794777MsoNormal"><span style="font-size:10.0pt;font-family:Arial, sans-serif;">  </span></p><p class="yiv1796794777MsoNormal"><span style="font-size:10.0pt;font-family:Arial, sans-serif;">781-861-0402</span></p><p class="yiv1796794777MsoNormal"><span style="font-size:10.0pt;font-family:Arial, sans-serif;">781-718-8334  cell</span></p><p class="yiv1796794777MsoNormal"><span style="font-size:10.0pt;font-family:Arial, sans-serif;">13 Hawthorne Lane</span></p><p class="yiv1796794777MsoNormal"><span style="font-size:10.0pt;font-family:Arial, sans-serif;">Bedford MA</span></p><p class="yiv1796794777MsoNormal"><span style="font-size:10.0pt;font-family:Arial, sans-serif;"><a rel="nofollow noopener noreferrer" ymailto="mailto:jjrudy1@comcast.net" target="_blank" href="mailto:jjrudy1@comcast.net">jjrudy1@comcast.net</a></span></p><p class="yiv1796794777MsoNormal"><img border="0" width="124" height="115" style="width:1.2916in;min-height:1.1927in;" id="yiv1796794777Picture_x0020_1" src="cid:OJU8P4bCuatZ8JL58S0h" yahoo_partid="1.2"><span style="font-size:10.0pt;font-family:Arial, sans-serif;"></span></p><p class="yiv1796794777MsoNormal">  </p></div></div></div>===============================================<br>::The Lexington Computer and Technology Group Mailing List::<br>Reply goes to sender only; Reply All to send to list.<br>Send to the list: <a ymailto="mailto:LCTG@lists.toku.us" href="mailto:LCTG@lists.toku.us">LCTG@lists.toku.us</a>      Message archives: <a href="http://lists.toku.us/pipermail/lctg-toku.us/" target="_blank">http://lists.toku.us/pipermail/lctg-toku.us/</a><br>To subscribe: email <a ymailto="mailto:lctg-subscribe@toku.us" href="mailto:lctg-subscribe@toku.us">lctg-subscribe@toku.us</a>  To unsubscribe: email <a ymailto="mailto:lctg-unsubscribe@toku.us" href="mailto:lctg-unsubscribe@toku.us">lctg-unsubscribe@toku.us</a><br>Future and Past meeting information: <a href="http://LCTG.toku.us" target="_blank">http://LCTG.toku.us</a><br>List information: <a href="http://lists.toku.us/listinfo.cgi/lctg-toku.us" target="_blank">http://lists.toku.us/listinfo.cgi/lctg-toku.us</a><br>This message was sent to <a ymailto="mailto:bobprimak@yahoo.com." href="mailto:bobprimak@yahoo.com.">bobprimak@yahoo.com.</a><br>Set your list options: <a href="http://lists.toku.us/options.cgi/lctg-toku.us/bobprimak@yahoo.com" target="_blank">http://lists.toku.us/options.cgi/lctg-toku.us/bobprimak@yahoo.com</a><br></div>
            </div>
        </div></body></html>