医学生如何用GPT做科研分析|Prompts汇总

文摘   2024-06-14 18:01   广东  

点击上方卡片可以查看本系列更多文章

每一天,站上更高的点。Get better, q.d.

这里是JANUS

也是B站up主@JANUSBANANA

现在专硕在读,更新可能不太规律~

GPT是一个很重要的辅助工具,让我们这种非专业的编程小白可以用R,stata这些语言和电脑沟通,去做分析、画图、制表,不过可能是自己老了,最近才开始尝试总结一下GPT的prompt,让自己和GPT沟通更顺畅。

2024年4月以后,GPT3.5模型已经免费使用了,而且无需登录,代价是无法保存聊天记录,每次关掉标签页重启就是一张白纸。

2024年5月,GPT-4o突然又限量免费了,能做的事情更多了。

文章末尾也会给不方便的同学提供下载好的Prompt,大家可以直接获取。



01
决定菜单


做一项研究就像做一顿大餐,包含很多道菜,各有各的做法,每一道菜都是分开来做的。


例子

我希望做一个睡眠和糖尿病的研究,目的是看看,睡眠的参数和糖尿病发病有何关系?我手头有一个队列研究的数据包,里面和睡眠有关的参数有10个,还有随访时间,糖尿病诊断。还有一些协变量。我的这个研究里面有三个必不可缺的结果:描述性分析,相关性分析,预测模型构建。


解读

我的大餐名为:睡眠的参数和糖尿病发病的关系,这一顿饭包括三道菜:描述性分析(根据数据类型使用ANOVA,卡方,非参数检验等),相关性分析(Cox回归或Logistic),预测模型构建(Cox回归,时间依赖型ROC曲线)。

目前GPT,至少免费的GPT3.5一般一次问答只能承担一道菜的制作,有时候甚至还不太够,需要多次提问。所以决定菜肴是很重要的,划分研究的不同部分,先写好大纲,决定好results部分有几段,这样才能用好GPT。

接下来,我们要用GPT来帮我们做每一份饭菜。



02
制作菜肴


我是谁,我有什么厨具,我在做什么饭,我需要什么菜式?我有什么原料,用什么烹饪手段?如何摆盘?

下面我们用相关性分析作为例子


例子

I am a medical researcher conducting a study about sleep and diabetes in R. I want to reveal the association between the sleep duration, waking time during sleep and incidence of diabetes in a cohort. Now I have a data file name "data_original". it contains key variables named "sleep_duration", "waking_time", "incidence_diabetes". please use the R package "ezcox" to run single-variable cox regression, multi-variable cox regression adjust for "age", "sex", "bmi", then use "gtsummary" to draw a table showing the result of cox regression and use the "ggplot2" to draw a survival curve. Make sure that put all the codes in 1 block and every step comes with notes to assist understanding. 


解读

我是谁?我是医学研究者

我有什么厨具?我使用R(必要的时候可以加上系统,如linux)

我在做什么饭?我想要做一个研究睡眠和糖尿病发病的研究。

我需要什么菜式?我想要探究糖尿病发病率和睡眠时长、睡眠觉醒时间的分析

我有什么原料?我有一个数据包名为xx,里面有几个关键变量名为A,B,C

我想用什么烹饪手段?如何摆盘?我希望用ezcox包跑单因素cox回归,再跑多因素回归,调整变量xxx,再用gtsummary包做一个cox表格总结cox回归的结果,最后用ggplot2包做一个生存曲线

我希望把所有代码放在一个代码块里面,穿插每一步的讲解,这样方便复制和理解;



03
他山之石



别人的Prompt

GPT作为一个通用模型,也有很多大佬贡献了他们自己的prompt帮助大家把GPT变成特定方向的助手,下面这个网址是我个人觉得最全的,不过是英文~

https://github.com/awesome-chatgpt-prompts/awesome-chatgpt-prompts-github


特定的GPT模型

现在GPT也开始逐步开放允许用户把自己“调教”后的特定GPT共享出来让大家免费试用,比如这个Github就收集了很多。

https://github.com/ai-boost/awesome-prompts?tab=readme-ov-file

如果大家不方便上Github,我把这两个网页保存了下来,大家可以在公众号后台回复“GPT助手”领取,里面的prompt也可以在其他LLM里面使用。但注意不能以任何形式倒卖获利,人家是free and public的!



04
最后还是靠自己


说到底用GPT写代码也只是辅助,写出来的代码会犯错,这是很正常的,在反复的报错和debug中学习,检验才是合理的。

而且,有些时候犯的错是甚至是根本性的,比如用错了统计方法,出来的结果没有任何bug,看似完美,但本质就是无意义的,经不起推敲。

所以,GPT虽好,但自己也不能偷懒,还是要去老老实实看每个包,每个函数有什么参数,适用于什么情况。否则,真的就是一个黑盒子,这样出来的科研成果根本不可靠。



THE END

Ok那么本期推文就到这里啦!

感谢你看到这里!留言一句

“我读完啦”

让我知道,可以吗?

求点赞,求关注,求分享!

做大家读医的同路人!

支持我 / 购买同款设备、滴眼液等等:


声明:

1.本文的文字部分,以及插图下方中标注有“作者原创”的部分,均为作者原创,保留一切权利,不得在未经作者同意时,以任何形式转载,二次创作等。

2.本文未标注“作者原创”的插图来自于网络,仅供分享学习,无商业使用目的,如有侵权,请邮箱告知,作者将尽快处理。

3.本文封面来源:作者二创。

JanusT
医学生一枚,伴你成长。USMLE/英语/科研/效率
 最新文章