点击上方卡片可以查看本系列更多文章
“每一天,站上更高的点。Get better, q.d.”
这里是JANUS
也是B站up主@JANUSBANANA
现在专硕在读,更新可能不太规律~
GPT是一个很重要的辅助工具,让我们这种非专业的编程小白可以用R,stata这些语言和电脑沟通,去做分析、画图、制表,不过可能是自己老了,最近才开始尝试总结一下GPT的prompt,让自己和GPT沟通更顺畅。
2024年4月以后,GPT3.5模型已经免费使用了,而且无需登录,代价是无法保存聊天记录,每次关掉标签页重启就是一张白纸。
2024年5月,GPT-4o突然又限量免费了,能做的事情更多了。
文章末尾也会给不方便的同学提供下载好的Prompt,大家可以直接获取。
做一项研究就像做一顿大餐,包含很多道菜,各有各的做法,每一道菜都是分开来做的。
我希望做一个睡眠和糖尿病的研究,目的是看看,睡眠的参数和糖尿病发病有何关系?我手头有一个队列研究的数据包,里面和睡眠有关的参数有10个,还有随访时间,糖尿病诊断。还有一些协变量。我的这个研究里面有三个必不可缺的结果:描述性分析,相关性分析,预测模型构建。
我的大餐名为:睡眠的参数和糖尿病发病的关系,这一顿饭包括三道菜:描述性分析(根据数据类型使用ANOVA,卡方,非参数检验等),相关性分析(Cox回归或Logistic),预测模型构建(Cox回归,时间依赖型ROC曲线)。
目前GPT,至少免费的GPT3.5一般一次问答只能承担一道菜的制作,有时候甚至还不太够,需要多次提问。所以决定菜肴是很重要的,划分研究的不同部分,先写好大纲,决定好results部分有几段,这样才能用好GPT。
接下来,我们要用GPT来帮我们做每一份饭菜。
我是谁,我有什么厨具,我在做什么饭,我需要什么菜式?我有什么原料,用什么烹饪手段?如何摆盘?
下面我们用相关性分析作为例子:
I am a medical researcher conducting a study about sleep and diabetes in R. I want to reveal the association between the sleep duration, waking time during sleep and incidence of diabetes in a cohort. Now I have a data file name "data_original". it contains key variables named "sleep_duration", "waking_time", "incidence_diabetes". please use the R package "ezcox" to run single-variable cox regression, multi-variable cox regression adjust for "age", "sex", "bmi", then use "gtsummary" to draw a table showing the result of cox regression and use the "ggplot2" to draw a survival curve. Make sure that put all the codes in 1 block and every step comes with notes to assist understanding.
我是谁?我是医学研究者
我有什么厨具?我使用R(必要的时候可以加上系统,如linux)
我在做什么饭?我想要做一个研究睡眠和糖尿病发病的研究。
我需要什么菜式?我想要探究糖尿病发病率和睡眠时长、睡眠觉醒时间的分析
我有什么原料?我有一个数据包名为xx,里面有几个关键变量名为A,B,C
我想用什么烹饪手段?如何摆盘?我希望用ezcox包跑单因素cox回归,再跑多因素回归,调整变量xxx,再用gtsummary包做一个cox表格总结cox回归的结果,最后用ggplot2包做一个生存曲线
我希望把所有代码放在一个代码块里面,穿插每一步的讲解,这样方便复制和理解;
GPT作为一个通用模型,也有很多大佬贡献了他们自己的prompt帮助大家把GPT变成特定方向的助手,下面这个网址是我个人觉得最全的,不过是英文~
https://github.com/awesome-chatgpt-prompts/awesome-chatgpt-prompts-github
现在GPT也开始逐步开放允许用户把自己“调教”后的特定GPT共享出来让大家免费试用,比如这个Github就收集了很多。
https://github.com/ai-boost/awesome-prompts?tab=readme-ov-file
如果大家不方便上Github,我把这两个网页保存了下来,大家可以在公众号后台回复“GPT助手”领取,里面的prompt也可以在其他LLM里面使用。但注意不能以任何形式倒卖获利,人家是free and public的!
说到底用GPT写代码也只是辅助,写出来的代码会犯错,这是很正常的,在反复的报错和debug中学习,检验才是合理的。
而且,有些时候犯的错是甚至是根本性的,比如用错了统计方法,出来的结果没有任何bug,看似完美,但本质就是无意义的,经不起推敲。
所以,GPT虽好,但自己也不能偷懒,还是要去老老实实看每个包,每个函数有什么参数,适用于什么情况。否则,真的就是一个黑盒子,这样出来的科研成果根本不可靠。
THE END
Ok那么本期推文就到这里啦!
感谢你看到这里!留言一句
“我读完啦”
让我知道,可以吗?
求点赞,求关注,求分享!
做大家读医的同路人!
支持我 / 购买同款设备、滴眼液等等:
声明:
1.本文的文字部分,以及插图下方中标注有“作者原创”的部分,均为作者原创,保留一切权利,不得在未经作者同意时,以任何形式转载,二次创作等。
2.本文未标注“作者原创”的插图来自于网络,仅供分享学习,无商业使用目的,如有侵权,请邮箱告知,作者将尽快处理。
3.本文封面来源:作者二创。