국문 초록
사비나 레오넬리의 "데이터 중심 생물학"은 데이터에 대한 전통적인 표상 관점에 대한 도전을 데이터 생산 맥락의 이론 적재성에서, 데이터 이동과 해석 과정에서의 사회적 영향과 이론 적재성으로 확장한다. 데이터의 탈맥락화 및 재맥락화는 과학적 결론을 뒷받침하는 데이터의 유용성을 약화시킴으로써 데이터의 증거적 가치를 약화시킨다. 증거적 가치에 따른 데이터 평가는 데이터에 대한 레오넬리의 관계적 관점에 동기를 부여했다. 이 관점에 따르면, 데이터의 의미는 근본적으로 데이터의 이론적, 사회적 환경과 얽혀 있기 때문에, 데이터의 증거적 가치는 데이터 표상주의자들이 가정하는 방식으로 가치-중립적 참이 아니다. 레오넬리는 생물학 분야의 데이터 큐레이터의 예를 들어, 이러한 사회적, 이론적 현실은 메타데이터에 이 정보를 인코딩함으로써 데이터 여정을 통해 데이터를 따라가야 한다고 주장한다. 하지만 나는 이 접근 방식에는 세 가지 한계가 있다고 주장한다. 1) 메타데이터도 이에 영향을 받을 수 있다. 2) 메타데이터를 해석하는 것은 데이터 생산의 맥락에서 이론적으로 더 멀어질수록 점점 더 어려워진다. 3) 전체 메타 데이터 정보 요구 사항은 실천적으로 충족 불가능하다.
나는 과학적 데이터에 대한 명제적 관점을 제안함으로써 이러한 문제에 영향을 받지 않는 대안적 접근을 제시한다. 레오넬리가 사용하는 데이터라는 용어는 세상에 대한 사실로서의 데이터가 아니라 인공물로서의 데이터를 가리킨다. 이러한 의미에서 데이터는 인코딩되고 과학적 형식을 갖춘 정보로, 관심의 대상인 사실에 대한 명제를 표상한다. 표상적 관점에서는 이를 사실에 대응되는 것으로 간주한다. 레오넬리의 논증은 데이터 이동은 이러한 대응을 약화시켜 데이터의 증거적 가치가 약화됨을 시사한다. 그러나 지시적 연속성은 존재자 실재론과 지시에 대한 인과 이론을 활용함으로써 성립할 수 있다. 존재자 실재론은 존재자들에 대한 인과적 조작이 그것들의 존재에 대한 정당성을 제공한다고 상정한다. 지시에 대한 인과 이론에 따르면, 실재하는 대상에 대한 용어는 직접적으로 지시하고, 내가 앞으로 주장할 것인데, 이 지시는 존재자의 실재성을 메타데이터에 인코딩함으로써 맥락들 사이에서 직접적으로 공유될 수 있다. 두 맥락의 명제는 동일한 대상을 지시하므로 모든 맥락에서 명제는 동일한 지시체를 지시한다. 이 접근 방식의 한 가지 한계는 속성 귀속에 대한 근거를 제공하지 않는다는 것이다. 그러나, 이 접근 방식은 근본적인 방식으로 전체적인 해결 방안으로 가는 경로를 제공한다. 이 접근 방식은 특히 기후 과학과 같은 분야에서 AI 데이터 분석과 같은 맥락 교차 연구의 증거적 가치를 높일 수 있는 잠재력을 가지고 있다.
영문 제목
Bridging epistemic contexts using entity realism and the causal theory of reference
영문 초록
Sabina Leonellis Data-Centric Biology expands the challenge to the traditional representational view of data from theory-ladenness in the context of production, to socially impacted and theory laden in the process of data travel and interpretation. The de-contextualisation and re-contextualisation of data undermines its utility to support scientific conclusions, thereby undermining its evidentiary value. The assessment of data according to evidentiary value motivated Leonellis relational view of data. In this view, the meaning of data is fundamentally entwined with its theoretical and social surroundings, such that its evidentiary value qua meaning is not a value-neutral truth in the way assumed by data representationalists. Leonelli argues that, following the example of data curators in biology, these social and theoretical realities should follow the data through data journeys through encoding this information into the metadata. However, I will argue that this approach has three limitations. 1) The metadata will also be susceptible to this. 2) Interpreting the metadata becomes increasingly challenging the more theoretically distinct one is from the context of production. 3) The total meta data information requirement is practically unachievable.
I present an alternative approach immune to these issues by suggesting a propositional view of scientific data. Data in Leonellis use refers to data as an artefact as opposed to data as matters of fact about the world. Data in this sense information encoded and given some scientific form, representing propositions about the matters of fact of interest. The representational view sees these as corresponding to matters of fact. Leonellis argument suggests that data travel influences undermine this correspondence, undermining its evidentiary value. However, referential continuity can be achieved by utilising entity realism and the causal theory of reference. Entity realism posits that causal manipulation of entities provides justification of their existence. According to the causal theory of reference, entity real terms refer directly and, as I will argue, this reference can be shared directly between contexts by encoding entity realness into the metadata. The propositions in both contexts refer to the same object meaning propositions in all contexts refer to the same referent. One limitation of this particular approach is that it provides no grounding for property ascriptions. However, it does provide a pathway to such a whole solution in a fundamental way. This approach has the potential to increase the evidentiary value of cross context research such as AI data analysis, in particular for climate science.