,

GenAI進行多輪提問答案生成

以下是經過與數個GenAI進行多輪提問答案生成,持續提問後,彙總作為一次性的、長篇的提示詞,看看各大模型的美國…

By.

min read

以下是經過與數個GenAI進行多輪提問答案生成,持續提問後,彙總作為一次性的、長篇的提示詞,看看各大模型的美國法律能力,包含判決檢索、判決摘要、判決推理歸結、事實檢索、事實法遵、推理能力、分項分析、分項歸結、判決預測、法律書類撰寫的綜合能力

#長提示詞:一次性的將原提示詞1到原提示詞11,組合成一個新的長提示詞,拿長提示詞,再一隻一隻拷問。除了以手機端用戶使用各大模型提供官版的APP之外,為了讓大模型回答的環境儘量保持一致,使用XXX~PoE的模式來一一測試各大模型

#原提示詞1

「根據美國著作權法及OpenAI的授權規定,以繁體中文分析以下報導及我的評價。此外,OpenAI授權規定,提到不得使用生成的結果去訓練其競爭產品。這個規定根據美國判決法有效嗎?

OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型 | 國際焦點 – 太報 TaiSounds https://search.app/JaukWkunt6DZuiuw6

從OpenAI生成的文章內容屬於美國著作權法保護的標的嗎?也就是說生成式AI生成的文字,是著作權保護的創作嗎?如果是,那麼應該屬於使用GenAI的人?還是OpenAI的智慧財產權?

還有以下是我的評論

OpenAI內部人士:有證據顯示DeepSeek盜用我們的模型 | 國際焦點 – 太報 TaiSounds https://search.app/JaukWkunt6DZuiuw6

這一則新聞報導的內容如果是真的,那麼OpenAI真是好好笑

不是說他們向OpenAI致敬嗎 🤔 關鍵在DeepSeek v3比較v2規模及能力大躍進的緣由是什麼吧,「科技中立」此應用軟體行業的憲章,走入全面資本化之後 應該不會只有政治正確?

否則川普應該全面趕走在 LLM產業鏈上下游的 非第一代美國籍的人們⋯讓科技不能流動的前提是,人才也不能流動⋯⋯科技中立的目的是為了全人類囉⋯😊

#原提示詞2

這個應該不是偷了OpenAI獨特的蒸餾技術,透過API也不太可能有機會 竊取 OpenAI獨特的蒸餾技術啊。

#原提示詞3

在去年2024Q2左右,大模型行業推崇的Agentic System 架構,就鼓勵大家 「以大模型生成數據,再去訓練自己的大模型」⋯所以我剛剛說 DeepSeek v3 規模及能力超越v2很多的原因⋯⋯一部分是因為數據,可能是經由OpenAI等大模型,多輪生成的數據,當作DeepSeek v3的預訓練的數據吧⋯⋯DeepSeek R1有介紹使用蒸餾技術,訓練了開源的 llama,Qwen囉

#原提示詞4

基於OpenAI訓練數據的來源已經發生許多爭議,其他開發者使用OpenAI創導的利用GenAI創造或合成新數據來訓練自己的大模型,反而受限於OpenAI的使用授權限制,根據美國法,是否只有壟斷法相關規定,才會讓OoenAI的授權規定失效?

#原提示詞5

承上,如果DeepSeek是以API連上OpenAI的GenAI付費使用生成的答案,以生成的答案 作為預訓練他自己DeepSeek v3的數據之一,並非以這些生成的數據作為蒸餾較小規模的大模型,例如 DeepSeek R1的話,是否也是違反OpenAI授權規定? 如果違反,這個授權範圍的限制與權利耗盡有無違反。請根據美國來回答。

#原提示詞6

請分析1)如果 DeepSeek是透過OpenAI雲端服務,付費生成數據,再將這些數據作為預訓練自己GenAI的產品的狀況 2)DeepSeek預訓練自己的GenAI產品是不收費用的狀況。 是否不一定構成對OpenAI的違約?請按照美國法分析。

#原提示詞7

鑑於新進者使用OpenAI生成的數據,是為了數據本質趨向高品質的狀況,那麼給予OpenAI的提示詞必須透過使用者自身精緻的、妥善的安排,生成出來的數據才能夠精化內容,再來訓練自己的大模型。從這個角度看,根據美國法,DeepSeek這種以精緻的提示詞讓OpenAI生成數據作為自己訓練數據的行為,根據美國法怎麼評價?

#原提示詞8

沒有經由OpenAI的API而直接上雲端使用OpenAI的APP的前述行為,是否仍有違反OpenAI的使用授權的約定?

#原提示詞9

如果DeepSeek就OpenAI生成的數據,在此稱為第一次新數據,僅作1)格式不同模型溝通的調整,或2)為了驗證第一次新數據內容的真實性而以新提示詞的模型,交付給自行開發的GenAI生成更新的第二次數據,而以第二次新數據訓練自己的大模型.

#原提示詞10

承上的分析,請接續根據美國法規定,分析以上兩種狀況

#原提示詞11

承上,DeepSeek在技術報告中提及,他的訓練方式,是以GenAI之合成數據,反覆數萬次重複的動作「將GenAI生成的新數據作為新提示詞,讓GenAI生成新數據,將新數據作為新的提示詞,繼續讓GenAai產生更新的數據」 在這種狀況下,是否屬於「轉化性使用」而適用合理使用?」